基本上会保证在相对前面,但内部用BM25计算的,如果有些文章包含的词次数更多可能会在前面吧。 最好给出例子和实际页面。
比如,我搜索 "高考语文" 实际得到的结果里, 很多只包含 "高考" 和 只包含"语文"的结果, 比"高考"和"语文"两个词都包含了的结果排得要靠前. 如何才能让 "高考"和"语文"两个词都包含了的结果 排在最前,接下来才是只包含一...
请问如何同时按relevance和某个字段同时排序?Xapian好像是支持的,Sphinx是支持这个的。比如我想按relevance和时间同时排序,让新发布的文章(产品)在保证相关度的前提下尽量往前面排序,如何做到?
[b]请问如何同时按relevance和某个字段同时排序?Xapian好像是支持的,Sphinx是支持这个的。比如我想按relevance和时间同时排序,让新发布的文章(产品)在保证相关度的前提下尽量往前面排序,如何做到?[[/size]/b][size=x-large]
不建议用排序。。这样按值排序在结果匹配数量多时必然慢。 全文检索的优势在于相关性算法,相关度排序看看是否正常。
最长的词16个汉字,250个英文字母。 应该是你的词典做错了,比如字符集不匹配之类。生成词典要严格按照字段区分开,字段之间用区分,这说都有相关的说明,按说明操作应当没有问题。
...法应该不可行。你可以尝试另外做一个索引库,记录 ff 相关的原词来做高亮。 3. 排序内部不是这样计算的,按BM25公式排序,你这样要求似乎做不到。。。另外二次开发xapian或许可以 4. 用的是同样的算法检索 log_db 效率还是不...
...法应该不可行。你可以尝试另外做一个索引库,记录 ff 相关的原词来做高亮。 3. 排序内部不是这样计算的,按BM25公式排序,你这样要求似乎做不到。。。另外二次开发xapian或许可以 4. 用的是同样的算法检索 log_db 效率还是不错...
...功能,分面搜索现在非常流行于各种 WEB2.0 、电子商务等相关的站内搜索。 参见专项文档:[url]http://www.xunsearch.com/doc/php/guide/search.facet[/url] 3. 多字段联合排序功能,习惯了 SQL 的用户往往都会碰到多字段不同方式的联合排序...
...义分词、字段检索、布尔搜索外,还直接支持用户急需的相关搜索、拼音搜索、搜索建议等专业功能。 [attachment=42] 某次扛压实验结果: ---------- SERVER INFO BEGIN ---------- { id:worker3, uptime:3623, num_burst:1, max_burst:132, num_accept:...