中国国民党荣誉主席连战及随访 结果分词就把“连战及”分到一起了。 请问有解决办法嘛? 似乎两个字的名字,容易和后面的字分到一起。 我在论坛中看到了“武松杀”的帖子,但是貌似没有解决办法? 谢谢。
[quote='bigxu' pid='8028' dateline='1401362359'] 最大可能是没有正确运用xunsearch [/quote] 是的...后来装了第三方反感的监控发现是获取结果之后的缓存问题..感谢管理员回答TT
...方式加载dba函数,但.cdb文件一直无法读,想自己生成,结果它生成了2个文件。dict.dat dict.idx 还是没办法用 php是5.2的,请问还有什么办法啊,谢谢啦:)
...试'); // 混合纠错得到: xunsearch测试 ~~~ > tip: 建议在搜索结果数量过少或没有时再尝试进行拼写纠错,而不是每次搜索都进行。 搜索建议 -------- 搜索建议是指类似百度那样,当用户在搜索框输入少量的字、拼音、声母时提示...
我把机器自带的PHP5.1删除了。然后用源代码的形式安装了5.3的php ,然后再安装xunsearch ,成功后在运行 sdk/php/util/RequiredCheck.php 结果出现提示: /usr/bin/env: php: 没有那个文件或目录 这是怎么回事?
...‘阿斯顿发斯蒂芬罗铭罗大大罗’这段话进行分词 其中结果为: 阿斯顿 阿斯 斯顿 阿 斯 顿 发 斯蒂芬 斯蒂 蒂芬 斯 蒂 芬 [b]罗铭罗 罗铭 铭罗[/b] 罗 铭 罗 大大 大 大 罗 [复合分词选项] 最短词 二元 重要单字 全部单字 ...
我举个例子吧 下面是用csws分词的结果,明显csws把email,网址给拆开了,还有标签没有去除,但是中文词是正确的分开了 postgres=# SELECT to_tsvector('zw_simple','pgsql中国社区论坛 http://www.pgsqldb.org:8079 chenaishen@263.net'); ...