这个是内置的一个复合分词功能。你要关闭这个功能可以在搜索时: $xs->search->setScwsMulti(0);
看了一下基本上说内置了中文分词 内置中文分词 好处我想应该索引会相对的小一些 但是坏处就是要维护词库 新出词语不用立马根据 所以问一下是否支持一元分词 这样就可以实现类似mysql like方式的搜索了
需要 NEAR 位置信息的话,目前只能用内置的 scws 分词 scws 目前不能自定义词库,你必须把词库转换成 dict.utf8.xdb 一个统一的词库放进 $prefix/etc/ 才可以
...er.txt,还是会扫描、装载etc目录下所有的txt? 3、自定义词库后,系统内置词库是否同时还生效,还是只用用户自定义了? 4、能否在北大词性列表外和@外自定义词性,比如美食类、休闲类、餐厅名我想分别定义为:nms、nxx、nc...
我举个例子吧 下面是用csws分词的结果,明显csws把email,网址给拆开了,还有标签没有去除,但是中文词是正确的分开了 postgres=# SELECT to_tsvector('zw_simple','pgsql中国社区论坛 http://www.pgsqldb.org:8079 chenaishen@263.net'); ...
经过开发给不断的努力和测试,以及吸收了大量网友的反馈意见,很高兴于今天发布 Xunsearch 1.2.0 正式版。 这次修订主要是开发了一些新功能,同时修正了一些 BUG,强烈各位用户建议升级到该最新稳定版本。新增的主要功能...