...老马10年,现在才来膜拜高人,来晚了:D 目前在做全文搜索引擎的选型,计划用于海量的文本内容检索(如邮件,备忘录,联系人,文档等碎片化数据),不知xunsearch是否能满足?下面是几个疑问 1)xunsearch 基于xapian,那xapian...
...建议,BBS中很多 \x1b (即 ascii=27 ESC键)的控制符,应该在建索引时给预过滤可能更好。 \033[1;31;44m 这样的格式,用正则过滤掉就好了。此外,我看到了你默认搜索的是 2年内,所以可能效果上采用了 value compare (addRange)的所以效率...
...ype = string [keywords] type = string [sendtime] type = numeric 在添加索引时,文档中有说会自动转码,所以所有字段都不需要用iconv将gbk转为utf-8就可以正常使用。sendtime在数据库中是时间戳(int型,需要排序),按文档中使用numeric,搜索出来...
...uilding" 就退出了。:@ 代码参考: [php] // 宣布开始重建索引 $index->beginRebuild(); // 然后在此开始添加数据 ... $index->add($doc); ... // 告诉服务器重建完比 $index->endRebuild();[/php] 我的代码应该没有问题, 目前我使用了先清...