恩,我也出现这样的问题,我编码是GBK,加载txt自定义字典后无法取得字典中的内容。 你这种写法txt会把上面的xdb覆盖掉的。 可以使用add_dict增加xdb字典的后面并优先。
这个应该没办法,所有的调整都是基于词典,也就是词典的优先级最最高了。 可以用程序扫出类似的词来删除它们,因为互联网语料库这些自动都列到词里了。
这个分词系统虽说是简易的,但是我觉得还是过于强大了 譬如说像我们行业类网站,要分的词不多,屈指可数,也可能就几百个 如果能提供分词方法,和一个自己可以添加的词库就好了 呵呵 谢谢
非常不错,可以继续琢磨一下如何优化。第二次搜索同一关键词缓存起作用后速度应该能明显变快 此外似乎没有开启拼音相关的功能,个人认为拼音相关的纠错功能还是很实用的
其实我们提供的搜索方案是提供API的,简单来说就是你可以通过API维护数据。至于如何同步完全取决于你的作法和设计,至于JOIN也一样,这个本身不是XUNSEARCH的功能 但我们提供的辅助工具 Indexer.php 也支持 JOIN语句和多表导入。
一个项目支持255个字段,你可以考虑合并为同一套字段方案,只要一个INI。 若实在需要分库,想办法合并结果吧。。。
[quote='hightman' pid='685' dateline='1333164501'] 没有最低要求啊,能装的就可以 [/quote] :s我的256的VPS好像是能够安装,但是开不起来。因为内存不够用。
你没发现你的逻辑混乱嘛? 你只要开启 fuzzy 相当于 ”杭州 OR 西湖“就可以了,这样既包含杭州又包含西湖的自然权重会高一些在前面,除非你强制了 setSort ...