...法用而已。。 因为英文中都是用空格进行分割的 不过如果将ft_min_word_len改为2, 然后在程序里将内容用scws进行分词,然后存入数据库单独的字段里,用空格分开,检索的时候, 用mysql的全文检索,可以检索到结果, 然后在...
...语句是 cate:1 OR cate:5 OR cate:3 ,目前看来没有问题。但是如果我要搜索的分类很多的话,构造的搜索语句会由于过长而报错,请问对于这种需求,用什么方法搜索合适?
如果分词次数太多,很容易引起服务器假死,linux服务器! 请问老大有没有加载到内容进行调用的方法?
没有特别去开进程来修改索引库阿. 我这里只是在数据有更新时才会执行性一次 --rebuild索引, 都是手工来做的. 我们现在的处理方式: 凌晨4:00 固定的去重起xunsearch, 如果没有做, 凌晨4:00多就挂掉。很奇怪,每天都这样。。
...进? 2)数据量起步在1亿条左右,检索速度能满足么?如果分库,是联库检索吗? 3)xapian一般应该是定时建索引,能否支持实时建?若不能,有无替代办法? 4)有没有pdf,doc,ppt之类的入库工具? 多谢多谢!
...的项目中禁止词是放在数据库里面(为了方便增删改),如果每次加载词典都要把禁止词写到临时文件,然后添加,觉得有点过于麻烦。是否可以提供添加单个或多个词的函数? [/quote] 现在没有这个需求了,因为我的非法词...
应该是分词词典没有正确加载。 如果你在php.ini中没有正确指定路径的话scws.default.fpath以及字符集 scws.default.charset 你应该在分词代码中明确指定这些 $s->add_dict(); 或 $scws->set_dict(); 还有 $scws->set_charset() 应该在此之前调用
en Indexer.php 里默认就是设为0的啊,自己做导入程序的话默认是5秒,如果时间很长需要自己设置 0 表示永不超时,直到主动关闭。
... $this->setProject($this->xs->getName()); }} 打开服务端连接 如果已关联 XS 对象, 则会同时切换至相应的项目名称
...对的。 你的cat_id是数字吗? getAddTerms 打印出看下。 如果有index,有term。查不出应该是不可能的. [/quote] [quote] $search->setQuery($array['word'])->setSort($array['sort'])->setLimit($array['limit'], $array['offset'])->search(); [/quote] 做了这样 [quote] ...