版主您好,我在自定义词表里加了一些数字+字母的词,如pm2.5,101大楼这样。 使用的时候发现无法正常分出来,我看到新版是加了一些强制拆分的功能,但是对自定义词表里的词,也是强制拆分的码?
...了,比如我要做计算机专业的分词,其中很多就需要用到一些专业英文单词分词。比如一篇文章是linux相关的我想让“linux”这个词优先被选出来,我在词典里加了linux 可是由于在文章中linux的出现频率低,就不能被分出来反而一...
...今天发布 Xunsearch 1.1.0 正式版。 这次修订主要是开发了一些新功能,同时修正了一些小BUG,强烈各位用户建议升级到该最新稳定版本。新增的主要功能如下: 1. 数据库后台智能分库和切割,对于数据量巨大的用户的索引速度...
...今天发布 Xunsearch 1.2.0 正式版。 这次修订主要是开发了一些新功能,同时修正了一些 BUG,强烈各位用户建议升级到该最新稳定版本。新增的主要功能如下: 1. 新增搜索日志管理工具 util.Logger,可用于管理热门搜索、相关搜...
...二元分词器,某些情况下可以正常工作,不过有时会返回一些意想不到的结果,而且相关度看起来并不高,所以很困惑,最下方是我的具体代码实现,我试验的对象是英文名,比如有两个名字:San Zhang和randy hong,我按照这种方...
...订版 1.0.1 正式发布。 该版本主要是针对上一个版本的一些细节改进和BUG修正,强烈建议所有用户升级到这个最新版本。 其中有一个重要改进是针对搜索日志(用于热门搜索、相关搜索等),阻止一些废词进入搜索日志。如...
第三个测试版,修正了一些重要 BUG 并完善了全部 PHPUNIT 测试代码,正式版指日可待了。 下载地址:[url]http://www.xunsearch.com/download/xunsearch-full-latest.tar.bz2[/url] 代码仓库:[url]https://github.com/hightman/xunsearch[/url] 修改日志:[url]https://...
[quote='hightman' pid='432' dateline='1326431112'] 对于字段搜索,内部转换时会自动加上一些括号,所以可能超标了。 [/quote] 那只能缩短搜索语句了呀?有什么其他方案么?老是给你添麻烦,呵呵 ,抱歉那。