先编译安装 libscws,然后用 --with-scws 指定啊;用整个安装包就不需要这么麻烦
...这样你可以考虑自己拓展一个 Tokenizer 类,然后根据自己需要生成 tokens 就可以了。 二元分词并不是直接分成N长的若干段,而是 ABCD => AB + BC + CD 你的作法会把 ABCD => AB+CD 这样搜索 BC 就搜索不到了。。。
一个项目支持255个字段,你可以考虑合并为同一套字段方案,只要一个INI。 若实在需要分库,想办法合并结果吧。。。
[quote='hightman' pid='4060' dateline='1296558618'] 少量加几个不需要优化。。。。甚至加千把个万把个也可以不优化呵。 可以等待到比较稳定时再集中优化一次。 [/quote] 好的谢谢!
需要增加一个新词“中国梦”。 使用的php XDB工具,增加词库后导入生成xdb文件。 重新生成coreseek的索引 索引的时候还是搜不出来这个词。 我确认使用的是utf-8 no-bom头的格式。 请问如何解决。谢谢
... 嫉妒 请问怎么去除分词中一个字的关键词。因为我不需要分词结果中有 一个字 的。 麻烦高手过来看看。应该怎样解决。谢谢了。
...100的限制是给CACHE做准备的,也比较符合用户的需求。 您需要一次展示这么多搜索结果吗? 你可以试试 src/task.cc 中的 746 行: 746 if (limit > MAX_SEARCH_RESULT) limit = MAX_SEARCH_RESULT; 在行开头加上 // 然后重新编译试试
如题,小弟需要一个txt词典,但是不会php,所以希望好心人能够给我一个txt版本的dict.xdb词典,谢谢