从与用户的交流情况看,很多人偏爱 util.Indexer 的 --rebuild 选项,因为它是平滑重建,让人感觉很可靠。 由于 XSIndex::beginRebuild 和 XSIndex::endRebuild 必须配对使用,但如果索引创建过程出现某些错误导致程序提前结束,那么由于...
...本没有什么特殊意义。 比如说 “到” 这个可以组成很多词的 得到,做到,想到,跑到,到达…… 过滤的词新增加文本词典,我要一个个词组去过滤,明显很吃力。
...中有H61,是不是只能自定义分词了?像这种商品的型号中很多类似的,如华硕主板H87-PLUS,H61、H87分别代表不同的主板芯片组。
是的,牵涉很多。 另外一个想法是在xunsearch中支持python或 lua等script,感觉适应特殊要求的改动会少点(超字段数方案由脚本方案处理,觉得处理好255这个特殊vno,就可以突破。)。还有就是对xapian的扩展有了可能。在贵公司提供商...
...方法似乎并没有从根本上解决问题,如果我要查询的分类很多的话,比如30个,还是会报 Data/Name too long 的异常,有没有能够从根本上解决这个问题的方法呢?还是我的搜索策略需要改变?
还有一个建议,BBS中很多 \x1b (即 ascii=27 ESC键)的控制符,应该在建索引时给预过滤可能更好。 \033[1;31;44m 这样的格式,用正则过滤掉就好了。此外,我看到了你默认搜索的是 2年内,所以可能效果上采用了 value compare (addRange)的...
...。 因为项目的实际需要,数字和字母超位2位的情况会很多,请问下:“最多只支持2位” 这种限制是在 /etc/rules.utf8.ini 中定义的,还是在源码里处理的? 如果要修改,使其支持更大长度的分词,该从哪里入手呢? 麻烦了!...
...搜索的结果, 甚至影响到了相关搜索的内容 但由于很多站长要做SEO,又不想屏蔽搜索引擎,请问这个问题如何解决?
配置的ini文件中,创建了很多的字段,这个对索引的速度有影响吗?影响有多大? project.name = s1 project.default_charset = utf-8 server.index = 8383 server.search = 8384 [xsid] type = id [pid] tokenizer = full type = numeric index = self [tid] type = str...
...修復?(這些數據都是使用程序邏輯進行添加了,包含了很多不同系統的索引數據,數據量有上百萬條,重新索引需要一定的時間)