...试运行中。它在算法与写法上都有相当大的改进,支持自定义规则的人名等专名自动识别,也支持UTF-8/GBK等不同字符集。经评估测试分词准确率在 95% 左右,召回率有 92% 以上。 这套程序的开发其实很早就开始做基础工作了,...
不明白你说的。同义词是基于分词后的结果制作的。 如果你的索引先前制作,后面再添加自定义词,那么当然无效了。你要重建索引
你可以正常分词试试,然后打印一下词的 attr 属性到底是不是* 号 我估计是不是你自定义词典先于默认词典加载,导致attr属性被覆盖了?
... Public 属性 隐去继承来的属性 名称类型描述定义于 connString string 连接字符串 XSServer customDict string 获取自定义词典内容 XSIndex project string 获取当前项目名称 XSServer respond XSCommand 从服务器...
...致用不到分词,只是靠在一起时需要消岐才用得到。你自定义词典用不了要查查是什么别的原因。 通常问题: 1.词典写的字符集不对,比如把GBK当UTF-8了 2.词典更新后的修改时间由于某些原因比/tmp目录下生成的临时xdb还要旧,...
...档、辅助脚本工具等。 [b]全功能:[/b]除支持基础的自定义分词、字段检索、布尔搜索外,还直接支持用户急需的相关搜索、拼音搜索、搜索建议等专业功能。 官方网站:[url]http://www.xunsearch.com/[/url] 下载地址:[url]http://www....
... Public 属性 隐去继承来的属性 名称类型描述定义于 cutlen int 剪取长度 (单位:字节) 用于在返回搜索结果自动剪取较长内容的字段, 默认为 0表示不截取, body 型字段默认为 300 字节 XSFieldMeta name string 字段...
...量对象返回值 * 2011-09-19 hightman: 修正 'xs-import' 中一处宏定义引发的悬挂错误 * 2011-09-18 hightman: PHP-SDK: 修正 'util/Indexer.php' 中 ob_flush() 调用前没判断的问题 * 2011-09-16 hightman: PHP-SDK: 添加一些 PHPUnit 测试代码并修正 XSTokenizerSplit ...
...档、辅助脚本工具等。 [b]全功能:[/b]除支持基础的自定义分词、字段检索、布尔搜索外,还直接支持用户急需的相关搜索、拼音搜索、搜索建议等专业功能。 官方网站:[url]http://www.xunsearch.com/[/url] 下载地址:[url]http://www....
...,如"23,435,66,6",想要搜索出分类id为6的数据,可以使用自定义分词,用","分隔这样设置字段: [cat_id] index = self tokenizer = split(,) 然后使用字段索引搜索就可以解决问题了; 不过有下面需求的时候我就不知道怎么解决了: 有一...