[quote='admin' pid='2688' dateline='1291049346'] 词库没有正确加载,你检查一下 /usr/local/scws/etc/ 下的 .xdb 的文件属性,默认.tar.bz2 解开有可能是600,建议 chmod a+r /usr/local/scws/etc/* [/quote] 非常感谢,被这个问题折磨了1天,原来是权限问题...
符合条件的索引共有161条,但offset不是最后一页的情况下,显示的total为 310条 [code]# php Quest.php ~/dev/config/search/question.ini --query="answered:0 AND (status:0 OR status:1)" --limit 120,30|head -n 1 在 1,525 条数据中,大约有 310 条包含 answered:0 AND (...
我使用scws的C版本提供的接口对省份、地市信息进行分词,发现分词的结果有时不是希望达到的结果。例如: 1 洛阳市廛河华林水席村 希望的结果为:洛阳市 廛 河 华林 水 席 村(词典中有洛阳市,市廛,河华,华林) 实...
由于词库太大干扰所致,建议可以附加一个小词典(目的是删除这些无用词汇,以下我写出来作参考,把下面的文字存成dict.txt,然后在原有的set_dict之后加上 scws_add_dict(s, 'path/to/this_ad_dict.txt', SCWS_XDICT_TXT); 这样使文本词典生效. ...
不能正确分词,测试代码在 Windows php5 下运行正常 纠结问题所在 原话:“喜讯:谷歌中国宣布将关闭两大服务 终止与天涯合作” 分词结果:“谷歌中 宣布 关闭两” Windows 下分词就是正确的 分词结果:“喜讯 谷歌 中国 宣布 ...
我们网站有很多质量管理方面的报告,但在搜索的时候搜索出来排在前面的都是不相关的东西,请问我该如何调整?是我搜索日志的问题?还是要整理出一些自定义权重的词 使用我们自己的普通搜索,能搜索出关于质量报告...
试用了一下你做的自动分类建议系统,准确性不错,通过完善一些数据,准确性还有很大的提高。希望hightman能像scws一样开源,大家一起来完善它。 btw: 自动分类建议系统也是用c语言开发的吗?
...dateline='1299060024'] 试用了一下你做的自动分类建议系统,准确性不错,通过完善一些数据,准确性还有很大的提高。希望hightman能像scws一样开源,大家一起来完善它。 btw: 自动分类建议系统也是用c语言开发的吗? [/quote] 关...
...。 越来越大你的监控方式是什么呢?最好能给出较为准确的数据以便判断。 [/quote][hr] 其实代码只是在文档的例子中添加了一个循环。 [quote='hightman' pid='3438' dateline='1267692528'] 是什么版本呢,新的版本应该是没有内存泄露...
...性能考虑,搜索结果的匹配数量均被设计为估算值,并非准确值。 索引库内的数据总数 ---------------- 这个数量是真实准确的,并非估算,获取总量有以下两种做法,至于喜欢用哪种您自己决定。 * 调用方法 [XSSearch::getDbTotal] *...