...但是分词的时候会中断php执行,但是这个错误无法看到,只是中断了!希望大大能改进一下,让错误能够报出来,比如那个blitz模块就有错误报告。呵呵·
...一个分割后的TAG都可以搜索到。 [/quote] 我需要的功能只是分词。和搜索木有关系。考虑另外安装scws了。。。
TF/IDF值不会导致用不到分词,只是靠在一起时需要消岐才用得到。你自定义词典用不了要查查是什么别的原因。 通常问题: 1.词典写的字符集不对,比如把GBK当UTF-8了 2.词典更新后的修改时间由于某些原因比/tmp目录下生成的临...
...ine='1369116714'] 没有特别去开进程来修改索引库阿. 我这里只是在数据有更新时才会执行性一次 --rebuild索引, 都是手工来做的. 我们现在的处理方式: 凌晨4:00 固定的去重起xunsearch, 如果没有做, 凌晨4:00多就挂掉。很奇怪,每天...
xs-import 才是真正同步导入的进程,不要杀死。写入索引时占用CPU确实很高,这是正常的。 PHP 脚本上显示的完成只是将你的数据全部保存到缓存区,并不是真正写入到索引数据库中。
...程池,每一个搜索请求实际上对应的是一个线程,多进程只是为了平横请求。
...好能给出较为准确的数据以便判断。 [/quote][hr] 其实代码只是在文档的例子中添加了一个循环。 [quote='hightman' pid='3438' dateline='1267692528'] 是什么版本呢,新的版本应该是没有内存泄露了。 越来越大你的监控方式是什么呢?...
...以直接是配置文件的内容, 还可以是仅仅是文件名, 如果只是文件名会自动查找 XS_LIB_ROOT/../app/$file.ini
明白你的意思。总之,mem方式比xdb性能要高些,只是会占用比较多的内存资源,如果需要经常频繁的进行分词操作就应该采用mem方式,比如搜索引擎的建索引时主要耗费的时间都花费在分词上,反正现在内存也便宜,而且词典不...
[quote='hightman' pid='329' dateline='1323313833'] 配置不对,只是区间搜索 index = none 就行了。 addRange()的用法本身没有错。但希望你能附全代码,实在不行可以在 $search->search()之前或之后打印 $search->query 的值看看实际检索条件 [/quote...