没有啊,目前为止在 1.4.6 后没有人汇报这个情况哦。从你前面的日志看的意思就是在搜索时发生了索引库变动,但这也不可能死机啊。 xunsearch 内部会定时启动 xs-logging 整理搜索日志,这可以在 tmp/index.log 里看到相关记录。
...可阅读部分,HTML已过滤),视情况而定,搜索引擎还有可能抓出含有乱码的片段。 但是SCWS分词时似乎要求字符串中只能有中文和中文标点,否则就会分词失败。 请问这个是我对SCWS的使用方法不正确还是SCWS目前只能做成这样...
...致的问题挺多,这点是不是考虑规则权重调整一下? 2.可能是考虑性能问题,采取的局部寻优的办法也导致了一些问题,是不是考虑全局寻优,或者长一些范围内寻优?
比如用于查询一个分类id及其所有子类id时,id可能不是连续区间,使用addRange()不好使. 用例:用户搜索一个关键字后 点击分面搜索结果(某一顶级分类)进一步过滤搜索 所以建议search对象能否增加一个像sphinx api过滤接口: Prototy...
...只用其中一种肯定是不够的。 scws 里面先按逐字把所有可能的词都列出来,建成一个2维表,然后把有岐义的部分拧出来,以其中一个词为主体进行计算权重,看哪个情况最优。 此外还有根据rules规则匹配。 简单举个例子...
...程安全的,并没有使用全局变量和静态数据,只是返回值可能是指向一块动态内存,需要用户来释放。多个线程同时调用该函数并没有需要互斥的地方。
...于现有的词典去补充,你重建一个的话数据又都没有效果可能会比较差。SCWS主页上有一个TF/IDF计算器,你可以参看一下效果。 http://www.ftphp.com/scws/demo/get_tfidf.php
基本上会保证在相对前面,但内部用BM25计算的,如果有些文章包含的词次数更多可能会在前面吧。 最好给出例子和实际页面。
...采用这种 > 方式重建索引,由于原有索引被立即清空了,可能会有一小段时间无法搜索到数据。 > 因此,如果您对线上项目操作,建议参见下一章节中介绍的平滑方式重建索引。 $Id$