发布时间:2012-06-28 14:06 t
By 乡下人
比如说我想在搜索条件里面加相关性大于50%的怎么加呢
好像没有,你可以通过对检索的结果根据相关性排序一下,循环里再判断大于50%的才显示吧
发布时间:2013-05-11 10:05 t
By hq22
搜索建议,不是搜索日志中取出的吗?好像分词中取出来的。有没有办法只取出搜索日志中的词呢?从分词中取出的词相关性不好
来个邪门的方法,把六千常用汉字放进词典,坏处是会给相关性带来干扰
稍微正常的方法,去别的网站收集所有一字歌的汉字,导入,坏处是要记得更新
题外话,nutch默认就是单字索引,但为了单字要牺牲其他,比如最重要的...
不建议用排序。。这样按值排序在结果匹配数量多时必然慢。
全文检索的优势在于相关性算法,相关度排序看看是否正常。