需求是,我需要对一些内容的分类,采取不同权重设置,而对于一些无分类的内容使用较低权重(不能直接过滤,我希望没分类的内容能搜索到,只是希望排序靠后)。 demo中的案例使用没有问题,在实际开发中,发现没有起作...
...个addweight(), 针对一个字段加权, 测试时, 对几个文档权重增加很大 每个文档得分在14左右, 但是第一页20个结果中得分都在5分, 权重计算用的是布尔权重计算。 请问这是为什么?求解。
...8.10 i WORD ATTR我都能理解。 上贴说的逐字分词后 计算权重的时候使用IDF,貌似就是类似基于字典的最大概率方式来定义权重,或者说是对于歧义的取舍。 TF IDF 具体是指什么? 使用的概率计算公式能阐述下么? 谢谢。
不明白你说的具体什么意思。 addWeight 的权重可以是小数,注意微调。这个加的不是字段而是针对包含指定索引词的文档提权。
[quote='bigxu' pid='7789' dateline='1399872014'] 我也碰到过这个问题,是加了一个品牌字段,并且增加了权重。 [/quote] 。。。嗯,明明是一个已定义的词语,非要拆分了弄出一些不相干的结果。。。咋办啊
[quote='hightman' pid='931' dateline='1340167458'] title 默认带了一些附加属性,当然你也可以把 string 完全设置成和 title 一样 [/quote] title加了什么属性?需要检索的字段是string 如果都设置成title 再把权重改低 是不是比起string更优?
...么属性?需要检索的字段是string 如果都设置成title 再把权重改低 是不是比起string更优? [/quote] 那是没有区别的啊,title 的效果完全可以用string来做到,title 只是默认包含了一些属性的 string
...下,这是因为你既是自定义分词器又指定了 non_bool 参与权重计算。 那么 SDK 端先按自定义分词器拆分重新组合成查询语句,发送到 xapian 解析器时由于不是 boolean prefix,因此它又会调用内部切词法再次切割。 简单解决可以将这...