如題.. 请问如何使分词結果不包含單一个中文字的词? 不考慮词性.只要是單个中文字都不要,应該從哪里去設置最簡便?
...是不是很理解。上次我分“山楂树之恋”的时候。我想让分词分成:“山楂树”和“树之恋”。但怎么弄“树之恋”就是出不来。呵呵!
分词结果是: 我爱/n 吃/v 康师傅/nz 牛肉面/n [hr] 我喜欢吃康师傅牛肉面 分词也有问题. 我喜欢/n 吃/v 康师傅/n 牛肉面/n[hr] 大概知道什么原因了,我爱,我喜欢都在词库中标注为名词n 我爱 14.71 4.59 n 我喜欢 14.90 4.82 n 请...
杯具的分词词库和规则集导致这个结果, 稍后我看能不能简单调整一下规则集来获得比较好的效果。 查到原因了,是因为词库里居然有个错误的词叫“民医院”!! 建议删除该词重新生成词典或,写一个附加词典标记为删除。...
由于我刚刚了解scws的这个分词技术,我想请问一下高手,在一个文章里有很多的字,比如“我,的,在,”这些单字,是不是也会被分出来,我想问的是,能不能取出像地名,人名,词语, 我想在一个网站中应该这些,请问...
...衣、保暖内衣这两个词,我对语句“我的保暖内衣”进行分词的时候,只能分出来最长的“保暖内衣”,确没有分出来“内衣”,不知道问题在哪里? 另外一个奇怪的问题,我用官方的词典,里面也有这两个词,可以分出来...
...木,但搜索塔里木就会找不全数据。 而且,采用自定义分词的方法,好像没有效果。 我修改了dict_user.txt,其内容为: 塔里木 12.07 20.38 ns 然后重建索引,重启服务,但搜索结果依旧。 好像没有起作用。 可以到 http://www.heiheda...
...$cws->send_text('我爱看电影,不知道电影院里有什么?'); 分词的结果竟是:“我 爱 看 电 影 , 不 知 道 电 影 院 里 有 什 么 ? ” 这到底是怎么回事呢,安装过程都很顺利呀!就是不能正常分词![hr] 刚找到原因了,...
...纯单词进行检索效果相当好。长句略慢。。。。[/quote] 分词结果: [quote]1 . 全文检索 , 此次 全文 搭配 数据库 进行 。 测试 中 大概 有 45 万 篇文章 , 约 900 万个词 ( 是 分 好 的 词 不是 字 ) 。 检索 效果 还 不错 , 如...