需要 NEAR 位置信息的话,目前只能用内置的 scws 分词 scws 目前不能自定义词库,你必须把词库转换成 dict.utf8.xdb 一个统一的词库放进 $prefix/etc/ 才可以
因为“塔里木河”已经是个完整的词了,再细切也是“塔里+木河”。实在有必要可以自定义分词器或想办法将你要的词加入到索引中。
因为“塔里木河”已经是个完整的词了,再细切也是“塔里+木河”。实在有必要可以自定义分词器或想办法将你要的词加入到索引中。
希望能附上完整的PHP代码以及你的自定义词库,以做分析和测试。 从上面少结果的看,应该是词库不生效,而结果只按人名规则合成了2个人名,其它的按无效字符过滤。
...ch.com/doc/php/guide/util.logger[/url] 2. 小修改大提升,支持自定义 SCWS 分词词典,文本格式。但旧有索引必须重建,新增的词汇才能生效。 [url]http://www.xunsearch.com/doc/php/guide/index.dict[/url] 3. 其它一些 PHP-SDK 工具和 API的修改: XS...
... 版本 1.0.0 源代码 sdk/php/lib/XSTokenizer.class.php 自定义字段词法分析器接口 系统将按照 getTokens 返回的词汇列表对相应的字段建立索引 Public 方法 隐去继承来的方法 名称描述定义于 getTokens() 执行分词...
sdk/php/app/demo.ini配置 [php] [id] type = id [productsName] type = title tokenizer = scwsSplit [/php] 自定义字母、数字分词类 sdk/php/lib/XSTokenizerScwsSplit.php [php]