scws分词不正确的情况 1、中文夹杂连续两个以上英文或数字(例如:程jj序ii员e 正常,程jjj序ii员e 不正常) 2、英文数字组合中,同时含有连续一个以上英文或数字的组合(例如:w1156k 正常,w16ky不正常) 3、含有任意一个...
例如:搜索 “使命” 2个字时,结果很完整。 但 单独搜索 “使” 或者 “命” 时 就没有结果。其他单字搜索情况都差不多,要么结果不完整,要么连查询结果都没有。 请问这是什么情况?
搜索日志已被缓存,如果要清空缓存可以执行,$xs->index->flushLogging();
这是正常情况,分词的机制决定的。通常讲,搜索单字是不有意义的,一定有这个需求的话需要自己修改分词引擎让它支持拆为单字。 具体看 XSTokenizerScws 这节,可以自行扩展然后通过 setMulti 方法索引单字
这个是最新一期的更新修改的,当数字、字母连续3个以上时就不作为混杂元素了,会将它们切开。 起初是因为 iso9001 没有切词导致搜索 iso 或 9001均搜索不到
[quote='hpxl' pid='247' dateline='1321860679'] 搜索日志已被缓存,如果要清空缓存可以执行,$xs->index->flushLogging(); [/quote] 执行后,连续执行关键词搜索,均不出结果。还是array()