多词搜索时出来的结果,匹配度有问题,能查到percent()的值是怎么算出来的吗? [img]http://img19.wal8.com/img19/238493_20120306205136/p16nk0opk2rft1qi619v18ta1lla1.png[/img] 匹配度为什么是这样呢?
你的索引不止包含标题吧。这个匹配度是按 BM25 的算法公式来计算的。 见:[url]http://xapian.org/docs/bm25.html[/url]
project.name = product_search2 server.index = 192.168.1.222:8383 server.search = 192.168.1.222:8384 [sales_id] type = id index = both [title] type = title 这是索引文件。
...检索hash_64字段值完全相等的数据,然后根据hash_196字段按匹配度排序 我对xlen分词器不是很了解 这个排序mysql可以实现 但是mysql分割后的位置不是固定的 project.name = hash project.default_charset = UTF-8 server.index = /dev/shm/xs-indexd.sock se...
这个排序是综合计算的,这是这样简单的处理。具体你要分析一下为什么后面的会在前面,它的匹配度更高?
...你给我买的衣服“ match "你看的书" 和"一件衣服" 代码匹配出来相关度最大的是"你看的书",因为有2个词相同,而按照我们人的字面理解,相似度最大应当是"一件衣服" ,但这个只有1词个相同,所以程序就判断没有2个词相同的...