这个排序是综合计算的,这是这样简单的处理。具体你要分析一下为什么后面的会在前面,它的匹配度更高?
这是正常情况,分词的机制决定的。通常讲,搜索单字是不有意义的,一定有这个需求的话需要自己修改分词引擎让它支持拆为单字。 具体看 XSTokenizerScws 这节,可以自行扩展然后通过 setMulti 方法索引单字
...判断,如果有必要会自动结束重建来规避这个问题。 具体代码改法已提交进 GIT 代码仓库,预计下一版本包含这项改动。
... 词重为6.26 还有,在实际应用中,是不是不用管词频的具体值,只用知道其大小关系就行了? PS:看到之前有的发贴问类似的问题,得到答案说词重是对词频取1000000的对数,我试了一下是不对的! 本人刚接触分词,请多多...
[quote='hightman' pid='5117' dateline='1384135094'] 要有具体一点的信息,怎么个不行法。检索 的时候加上 --show-query 可以查看拆词结果 。 [/quote] 这样 还是搜不出结果 php Quest.php demo 1 在 3,000 条数据中,大约有 0 条包含 1 ,第 0-0 条,...
具体安装日志见:http://bbs.xunsearch.com/showthread.php?tid=765 我在一个vps(1G内存)上建立了两个项目,对应两个网站,大家可以测试下。效果蛮好的(已经抛弃了hdwiki自带的tag搜索和全文搜索,仅保留了它的title搜索)! a, 中文P...
...引重建(更新)的需求;检索出结果后,可以反向定位到具体是哪个分表,以便读取详细数据。
...yyyyyyyyyy [audit_time] => 1354253875 ) ) ... 具体实现: --------------myindex.php [php]
...可输出页面。 用RequiredCheck.php 检测也没发生什么错误,具体结果如下: +------------+------------+--------------------------+--------------------------------+ | 项目 | 结果 | 用于 | 备注 | +------------+-...
...='1384137103'] [quote='hightman' pid='5117' dateline='1384135094'] 要有具体一点的信息,怎么个不行法。检索 的时候加上 --show-query 可以查看拆词结果 。 [/quote] 这样 还是搜不出结果 php Quest.php demo 1 在 3,000 条数据中,大约有 0 条包含 1 ...