我说您写错的实例是说的,您添加自定义词库那里,您多写了一个t,[hr] 您说的我都检查了,没有错,但是就是分词不对,我下的都是您最新版本的,您自己看看是不是词库提供错了呢?分词真的不对。
... xapian-inspect 这几个工具可以检查一下数据库,看看是不是坏了。 还有你可以试试用命令行的 util/Quest.php --db=db_a,db 这样强制指定DB库来测试一下呢? [/quote] 原來的數據已經全部被折騰壞了,現在正在重新生成索引。
xs-import 才是真正同步导入的进程,不要杀死。写入索引时占用CPU确实很高,这是正常的。 PHP 脚本上显示的完成只是将你的数据全部保存到缓存区,并不是真正写入到索引数据库中。
... 我的要求比较强求,毕竟是设计您软件的核心内容。我不是抱着去盈利或者其他什么理由来学这个。 欢迎您给我发Email:nextyu.wang AT gmail.com 希望您能给我帮助,谢谢了。 P.S. 做事有一定的目的性,学习这个,一是个人爱好,...
“人们”“人家”“人民”是要全部去掉的。毕竟我们不是做搜索引擎,这类词根本没有什么特殊意义。 比如说 “到” 这个可以组成很多词的 得到,做到,想到,跑到,到达…… 过滤的词新增加文本词典,我要一个个...
重启后不应该还会提示 rebuilding 你可以 ps 看一下是不是重启成功了 试试先 bin/xs-ctl.sh fastrestart
...起作用,中文词汇是可以的。如果想分词结果中有H61,是不是只能自定义分词了?像这种商品的型号中很多类似的,如华硕主板H87-PLUS,H61、H87分别代表不同的主板芯片组。
我觉得scws的分词不错,但是xunsearch的搜索不是很符合我的要求, 我主要是数据库索引加搜索方面的,所以xs的索引建立是一大问题,看了一下貌似sphinx在这方面比较好,网上也看到过这样的案例,用sphinx+scws建立索引加分词,...
...search/dict.film.txt'); echo "\n-------\n"; 看看你的 dict.film.txt 是不是真的写入了?