是的,这是一个已经知道的BUG了(由于1.1.3版升级PHP的API导致的笔误),CVS代码中已经修正,但目前还没有发布新的 1.1.4版本。 建议直接用对像操作方式,即 $scws = scws_new(); $scws->get_result(); 用对像操作方式就没有这个问题。
...词库替换了dict.utf8.xdb,然后尝试分词“朝鲜近日播放的一个纪录片中,发现”,发现“纪录片中”在分词结果中丢失了 Array ( [word] => 朝鲜 [off] => 0 [len] => 6 [idf] => 0 [attr] => @ ) Array ( [word] => 近日 [off] => 6 [len] => 6 [idf] => 0 [attr] => ...
...太大了,两个条件就已经完全不准确,我可以确认是bug,我有一个同事独立安装xapian和scws,利用lib/xs.php的内容,作了修改,得出的值明显是准确的.也就是xapian本身可以得出相对正常的结果,但是使用xunsearch后,在多重排序后,结果不正确 ...
[quote='hightman' pid='3855' dateline='1291116538'] 是的,这是一个已经知道的BUG了(由于1.1.3版升级PHP的API导致的笔误),CVS代码中已经修正,但目前还没有发布新的 1.1.4版本。 建议直接用对像操作方式,即 $scws = scws_new(); $scws->get_resul...
[quote='hightman' pid='5090' dateline='1383799152'] 添加不会自动去重的哦。 [/quote] 还一个问题 我搜索123可以出来结果 搜索12 却不可以出结果 怎么回事?
... 搜索对象 $query = '部分'; // 这里的搜索语句很简单,就一个短语 $search->setQuery($query); // 设置搜索语句 $search->addWeight('title', 'xunsearch'); // 增加附加条件:提升标题中包含 'xunsearch' 的记录的权重 //$search->setLimit(1, 1); // 设置返...
...正呢? 例如,希望将,“了”的词性由 v 改为: e 新建一个userdic辞书,然后添加: 了 1.0 1.0 e 通过:scws_add_dict(s, "/usr/local/scws/etc/userdict.utf8.xdb", SCWS_XDICT_XDB); 结果还是不对。
...的词库.我估计如果搜狗要是也能加入中文分词阵营,会是一个很大的挑战. 这个api速度很快,再次感谢.
我也发现是这样的问题,我现在最新1.1.7,自定义一个词库后(),原词库就没有用了。 比如: new.txt(这个文件里,试过一个词也没有、添加个别词两种情况); $so = scws_new(); //$so->add_dict('', SCWS_XDICT_TXT); $so->send_text('广州...