...WS 词库 如之前所说,我们所有的索引分词器默认为 scws,这也是我们开发的开源分词系统, 内置的词库基本上能满足绝大多数应用。但总有例外,这也就是即将说的如何自定义词库。 全局自定义词库 ------------- ...
...件。 * _-c|--charset _ 指定当前环境、数据源的字符集,默认情况下, 索引工具输出的字符集为 utf-8,并把数据源字符集视为项目的默认字符集。 * _--source _ 用于指定数据源,数据源有以下 2 种情况。 凡是包含冒号的...