...段,而是 ABCD => AB + BC + CD 你的作法会把 ABCD => AB+CD 这样搜索 BC 就搜索不到了。。。
...词量比较大和不确定,那先用 XSSearch::addQueryTerm 来构造搜索语句。 或者等下一个版本,考虑给 xapian 打个补丁,对于某些自定义分词器的字段不再调用内部分词。
数据量太大了,导致分词搜索结果数太多,反而不精准了。 所以想在某些情况下可以关闭分词功能,输入的是什么就搜索什么。 翻到了这个帖子 http://bbs.xunsearch.com/showthread.php?tid=2141&pid=4025#pid4025 根据回复是设置为0即可,...
...url] 进行实测,分割结果为: E14188m E14188 14188 14188m 那么搜索以上4个词都是可以搜索到的,至于你从中提取 e1418 来检索,那是很难有合适的策略去匹配。
...个最新稳定版本。 [b]主要更新如下:[/b] 1. 增加基于搜索服务端的 XSTokenizerScws 便于直接使用 SCWS 的分词功能, 而不再需要额外安装其 php 扩展,用法详见 SCWS专题文档 [url]http://www.xunsearch.com/doc/php/guide/special.scws[/url] 2. 升...
...该类必须实现 [XSTokenizer] 接口。 字段设计 ------- 多数搜索项目可能都是和相关的数据库联动的,出于开发方便,强烈建议让搜索项目的字段命名 和实际数据库内的命名一致。在此基础下推荐以下命名规范: - 字段名都使用小...
测试代码如下,导致搜索:塔里木,会搜索不到结果。 require_once '/home/wlx/xunsearch/sdk/php/lib/XS.php'; $xs=new XS('westdc'); $tokenizer = new XSTokenizerScws; $text = '塔里木河下游浅层地下水变化的生态效应及生态系统健康评价研究项目的...
非常感谢...也在刚开始学习xunsearch xunsearch采用 scws 分词 xunsearch好像集成了 scws 对于分词 xunsearch 可以通过 XSTokenizer 扩展 我想问的是 既然是 集成scws 那么 1.有没有提供scws的api接口,实现短语分词功能 2.是否可以对scws自定义中文...
...字段配置 [userinfo] tokenizer = split(&) type = string index = mixed 搜索1=2 分词器不执行,搜索userinfo:1=2 分词器才会执行 这是怎么回事?
...字段配置 [userinfo] tokenizer = split(&) type = string index = mixed 搜索1=2 分词器不执行,搜索userinfo:1=2 分词器才会执行 这是怎么回事?