多词搜索时出来的结果,匹配度有问题,能查到percent()的值是怎么算出来的吗? [img]http://img19.wal8.com/img19/238493_20120306205136/p16nk0opk2rft1qi619v18ta1lla1.png[/img] 匹配度为什么是这样呢?
你的索引不止包含标题吧。这个匹配度是按 BM25 的算法公式来计算的。 见:[url]http://xapian.org/docs/bm25.html[/url]
project.name = product_search2 server.index = 192.168.1.222:8383 server.search = 192.168.1.222:8384 [sales_id] type = id index = both [title] type = title 这是索引文件。
...检索hash_64字段值完全相等的数据,然后根据hash_196字段按匹配度排序 我对xlen分词器不是很了解 这个排序mysql可以实现 但是mysql分割后的位置不是固定的 project.name = hash project.default_charset = UTF-8 server.index = /dev/shm/xs-indexd.sock se...
这个排序是综合计算的,这是这样简单的处理。具体你要分析一下为什么后面的会在前面,它的匹配度更高?
...你给我买的衣服“ match "你看的书" 和"一件衣服" 代码匹配出来相关度最大的是"你看的书",因为有2个词相同,而按照我们人的字面理解,相似度最大应当是"一件衣服" ,但这个只有1词个相同,所以程序就判断没有2个词相同的...
...[搜索结果文档](class.document), 如果没有任何符合条件的匹配则会返回一个空数组。 在获取搜索结果前您必须用[上一章](search.query)学到的知识先构造好相应的搜索语句 `$query`。 > note: 只有不带参数的 [XSSearch::search] 搜索调用才...
...档的序号值 (第X条结果) - `percent()` 取得搜索结果文档的匹配百分比 (结果匹配度, 1~100) - `weight()` 取得搜索结果文档的权重值 (浮点数) - `ccount()` 取得搜索结果折叠的数量 (按字段折叠搜索时才有效) 访问结果文档的字符集默认是...