...器 默认为 default 采用内置的功能强大的 scws 分词,适合绝大多数字符串字段。也可以指定自定义分词器,格式为 name 或 name(arg) 两种形式,其中 name 是分词器名称,arg 则是传递给分词器构造函数的参数。自定义分词器需要在 lib...
...事业所做出的杰出努力,现在网上发布的种种分词工具,绝大部分都只提供了控件或者插件而不直接提供源代码和分词词库,本人非常鄙视那些把分词技术归为秘密的人。共同学习才能共同提高,取长补短,分词是很重要的中文...
...版本。 1.3.0 堪称一个里程碑级的更新,实现了预期的绝大部分功能,将 xunsearch 带入一个新的阶段。我们以后将着力先进行稳定性的跟进,完善周边配套工具和应用产品。 [b]主要更新如下:[/b] 1. 内部优化中文复合词的查...
...个字母。 f 方位词 取汉字“方” g 语素 绝大多数语素都能作为合成词的“词根”,取汉字“根”的声母。 h 前接成分 取英语head的第1个字母。 i 成语 取英语成语idiom的第1个字母。 j 简称...