比如我要搜索 E14188m 这个词的时候,能搜索到。 但是当我要搜索 E1418的时候却无法搜索到。希望能够配置数字当做字符串
如下: 自定义分词字段 b_split_title [b_split_title] type = title tokenizer =coupon $search->setQuery( '(b_split_title:宠物 OR 宠物 ) AND b_city_id:31')->setlimit(1000000)->setFacets('b_tag_id')->search(); 打印: Xapian::Query(((or:(pos=1) AND 宠物:(pos=2) AND and:(pos=3) ...
...url] 进行实测,分割结果为: E14188m E14188 14188 14188m 那么搜索以上4个词都是可以搜索到的,至于你从中提取 e1418 来检索,那是很难有合适的策略去匹配。
想在搜索的时候,关键词按照自己的意愿来切分应该是要怎么做? 文档里看到有个自定义词库的设置,然后根据文档使用了下,发现没达到效果。比如说,我想搜索拥有"味道恶心"这个词的文章,(我的文档库里面是有相关文章的...
这个是最新一期的更新修改的,当数字、字母连续3个以上时就不作为混杂元素了,会将它们切开。 起初是因为 iso9001 没有切词导致搜索 iso 或 9001均搜索不到
分词并不影响一字歌的搜索。只要库内有那个“词”。 比如:陈百强-不.mp3 这样分词的结果是 [color=red]陈百强 陈百 百强 不[/color] 这样搜索”不“,搜索”陈百强“,”陈百“,”百强“都可以搜索到,怎么会不能搜索单字呢...
这是正常情况,分词的机制决定的。通常讲,搜索单字是不有意义的,一定有这个需求的话需要自己修改分词引擎让它支持拆为单字。 具体看 XSTokenizerScws 这节,可以自行扩展然后通过 setMulti 方法索引单字
...] [quote='benq81' pid='1380' dateline='1351136388'] 我看楼主现在的搜索挺准确的啊,是自己加了分词吗?还是别的办法~ [/quote] 当时给他建议后添加了自定义词汇,药到病除。。。 [/quote] 谢谢管理员,俺想问下,如果在dict_user.txt里...
... ; 索引服务端配置,默认值为 8383 server.index = 8383 ; 搜索服务端配置,默认值为 8384 server.search = 8384 ~~~ > note: 自 `1.4.7` 起,服务端地址可以使用 `;` 分隔指定多个。 > 索引更新将同步到所有服务端,而搜索则随...