...有起作用,估计是配置差别导致。经过反复对比,确定和字段的分词策略设置有关。 起初对于分类id这个字段,我认为设置成type=numeric index=full就行,从实验看,需要设置成index=self(默认采用scws分词),这样就达到了目的。 ...
...要的结果 搜索条件中我增加了一个addweight(), 针对一个字段加权, 测试时, 对几个文档权重增加很大 每个文档得分在14左右, 但是第一页20个结果中得分都在5分, 权重计算用的是布尔权重计算。 请问这是为什么?求解...
我用您发布的工具,把字典解压。得出了关于的词的字段 WORD TF IDF ATTR 当机立断 14.01 8.10 i WORD ATTR我都能理解。 上贴说的逐字分词后 计算权重的时候使用IDF,貌似就是类似基于字典的最大概率方式来定义权重...
不明白你说的具体什么意思。 addWeight 的权重可以是小数,注意微调。这个加的不是字段而是针对包含指定索引词的文档提权。
[quote='bigxu' pid='7789' dateline='1399872014'] 我也碰到过这个问题,是加了一个品牌字段,并且增加了权重。 [/quote] 。。。嗯,明明是一个已定义的词语,非要拆分了弄出一些不相干的结果。。。咋办啊
[quote='hightman' pid='931' dateline='1340167458'] title 默认带了一些附加属性,当然你也可以把 string 完全设置成和 title 一样 [/quote] title加了什么属性?需要检索的字段是string 如果都设置成title 再把权重改低 是不是比起string更优?
...成和 title 一样 [/quote] title加了什么属性?需要检索的字段是string 如果都设置成title 再把权重改低 是不是比起string更优? [/quote] 那是没有区别的啊,title 的效果完全可以用string来做到,title 只是默认包含了一些属性的 strin...