基本上会保证在相对前面,但内部用BM25计算的,如果有些文章包含的词次数更多可能会在前面吧。 最好给出例子和实际页面。
...试另外做一个索引库,记录 ff 相关的原词来做高亮。 3. 排序内部不是这样计算的,按BM25公式排序,你这样要求似乎做不到。。。另外二次开发xapian或许可以 4. 用的是同样的算法检索 log_db 效率还是不错的
...试另外做一个索引库,记录 ff 相关的原词来做高亮。 3. 排序内部不是这样计算的,按BM25公式排序,你这样要求似乎做不到。。。另外二次开发xapian或许可以 4. 用的是同样的算法检索 log_db 效率还是不错的
...果为 5 条,但要先跳过 15 条,即第 16~20 条。 ~~~ 设置排序方式 ----------- 默认情况,搜索结果根据内部算法计算相关度进行排序,采用著名的 `BM25` 算法,这在信息检索概率模型中表现 非常优秀,通常只要使用默认的算法即可...