...自定义词库后,系统内置词库是否同时还生效,还是只用用户自定义了? 4、能否在北大词性列表外和@外自定义词性,比如美食类、休闲类、餐厅名我想分别定义为:nms、nxx、nct,可否? 以上,麻烦各位解答,谢谢了 伪签...
...要是开发了一些新功能,同时修正了一些 BUG,强烈各位用户建议升级到该最新稳定版本。新增的主要功能如下: 1. 新增搜索日志管理工具 util.Logger,可用于管理热门搜索、相关搜索、搜索建议和纠错等内容。 [url]http://www.xuns...
...性,同时加入了项目级的自定义词库功能。强烈建议所有用户升级到这个最新稳定版本,以便发挥 xunsearch 的最大威力。 主要更新如下: 1. 升级整合最新的 xapian-1.2.13、scws-1.2.1 2. 新增支持项目自定义词库,[url=http://www.xunse...
... 调用 $cws->get_words("*"); 则可以获取黑词清单,显式地告诉用户它的内容包含了哪些非法词汇。。。 [/quote][hr] 你好,请问你。utf8 的词库为什么用不上啊。还有 gbk 词库 和 utf8 的容量区别也很大。有没有跟gbk 编码的一样 utf8词库...
...行自动分词,用于生成文章的tag,我自己给定了一个用户自定义词库,在$tokenizer->getTops()时,不能找出我想要的语词,$tokenizer->getResult能获取到所有分词的结果,不知道这个问题的原因是怎么产生的。请指点一下。 以下是...
... 调用 $cws->get_words("*"); 则可以获取黑词清单,显式地告诉用户它的内容包含了哪些非法词汇。。。 [/quote][hr] 你好,请问你。utf8 的词库为什么用不上啊。还有 gbk 词库 和 utf8 的容量区别也很大。有没有跟gbk 编码的一样 utf8词库...
...版本的主要变动记录,以及相关的文档链接, 方便新老用户快速查看。完整的更新日志请查看 [git 提交日志][1]。 版本 1.4.8 (2013-12-11) ---------------------- - 改进优化代码兼容性 - 增加用户案例文档:USERCASE - 改进自定义分词器 XSTok...
经过 freechoice、dull 等用户的热心反馈和测试,彻底解决了搜索服务进程偶发的死锁并导致进程卡死问题。非常高兴于今天发布 xunsearch-1.4.1 正式版,1.4.x 对比以前的 1.3.x 版在内存使用、IO等方面做了较大的改进,大幅提升了搜索...
...是名为 db 的库。 * _--filter_ 指定数据过滤器,针对资深用户使用,在提交索引前可以处理一次数据。 * _--add-synonym=_ 添加同义词。 * _--del-synonym=_ 删除同义词。 * _--stop-rebuild_ 停止异常中断的重建任务。 经典用法示例 -...
... 调用 $cws->get_words("*"); 则可以获取黑词清单,显式地告诉用户它的内容包含了哪些非法词汇。。。