我想咨询一个问题。SCWS官网简介上指出,SCWS中文分词系统(Simple Chinese Word Segmentation)经小范围测试准确率在 90% ~ 95% 之间。 上面的准确率是如何计算出来的呢?或者有其他类似的标准测试工具吗?谢谢!
[quote='benq81' pid='1380' dateline='1351136388'] 我看楼主现在的搜索挺准确的啊,是自己加了分词吗?还是别的办法~ [/quote] 当时给他建议后添加了自定义词汇,药到病除。。。
我希望在搜索之前获取搜索结果的准确数目,以及搜索结果中日期是今天的数目。我目前用的方法是构造搜索条件,然后调用 count 方法,但获得的结果有时是错误的,请问该怎么作?谢谢
搜索为了效率,计数是采用概率估算的,没有必要获取准确。 如实在有必要,可以在调用 search() 方法之前构造一个明显很大的 setLimit() 参数去调用
...些。 [/quote] 关键是差距太大了,两个条件就已经完全不准确,我可以确认是bug,我有一个同事独立安装xapian和scws,利用lib/xs.php的内容,作了修改,得出的值明显是准确的.也就是xapian本身可以得出相对正常的结果,但是使用xunsearch后,在...
...一些。 [/quote] 关键是差距太大了,两个条件就已经完全不准确,我可以确认是bug,我有一个同事独立安装xapian和scws,利用lib/xs.php的内容,作了修改,得出的值明显是准确的.也就是xapian本身可以得出相对正常的结果,但是使用xunsearch后,在...
...='benq81' pid='1380' dateline='1351136388'] 我看楼主现在的搜索挺准确的啊,是自己加了分词吗?还是别的办法~ [/quote] 当时给他建议后添加了自定义词汇,药到病除。。。 [/quote] 谢谢管理员,俺想问下,如果在dict_user.txt里加了词...