... 此外xapian在IR方面做得更好,sphinx 索引创建速度确实比较快,但其它方面个人认为远不如 xapian。 sphinx 也缺少存储,还要配合原有的数据库协同工作,相当不方便。 [/quote] 能否提高xapian创建索引的速度?
...$d1,$d2)这样写法会不会比上面的效率高?只是这种写法有时比较难写,因为有时要判断一些条件才能决定是否需要addRange
因为这个讲述起来比较复杂,而且多数用不到,所以一直缺这个文档。 rules.ini 是一个规则,比如像姓名或路名或章节数字之类,可以规定某些字凑在一起就视为整体,可以规定某些字开头或某些字结尾的N个字组成词组,基本...
MACOS比较 麻烦,因为正文UTF-8,目录是GBK,所以无法协同,我在MACOS用ICHM看好多文件时也出现过这个问题 。 下次把文件 统一用GBK编码可能 可以解决
...or_reporting(E_ALL ^ E_NOTICE); 第二,你的 PHP 是 5.1.6 版本确实比较早了,我们只测试了 5.2 5.3, 所以可能存在少量不兼容,建议有可能升到 5.2+,因为从打印 "object id #2" 来看,确实对 __toString 支持存在一些问题。
...源项目真心实用,最近在使用一切顺利不过关于两个函数比较疑惑。 使用的是php_scws.dll (1.2.1) ,php扩展 其一: strpos($w['word'],"5) 参数limit,设置分词数上限,可否不控制上限?参数是什么 其二: set_ignore(bool yes) 参数:true...
1)索引速度的慢其实是相对的,在一个大库里更新比较慢。但你可以变通分库,把最近的做成一个小库用以实时更新,再定期合并索引。 2)1亿条肯定要分库为佳,建议2000万左右一个库。可以联库索引,库也可是远...
首先多谢选择使用 xunsearch ,像你这样的站是比较典型的,方便的话可以留下网址。 搜索性能 0.5 秒应该是首次检索,第二次检索同样的关键词缓存应该会起作用。 再说一下如何分库 像你这样的贴子,应该说旧贴子不太可能...
...致这个结果, 稍后我看能不能简单调整一下规则集来获得比较好的效果。 查到原因了,是因为词库里居然有个错误的词叫“民医院”!! 建议删除该词重新生成词典或,写一个附加词典标记为删除。内容如下,保存为名字 del.tx...