... xunsearch 服务端,那么每个服务端独自使用自己的自定义词典文件。 添加删除修改自定义词库只要编辑该文件即可,以下为相关规范: - 文件为纯文本文件,编码必须是 UTF-8,可用任何编辑器修改 - 每行一条记录表示一个词...
...] 完成,主要目的是用于类似黑词判断。 您可以自制一个词典,并将黑词统一设置为一个独特的属性,比如 "@", 那么就可以用该功能判断一段文本是否包含黑词。 ~~~ [php] $text = '...'; if ($tokenizer->hasWord($text, '@')) { // 包含词性...
...性更好功能更强 - 修改 XSTokenizerScws 以支持项目级自定义词典的 - 自定义分词器的字段也能参与权重计算了,在 ini 指定 `non_bool = yes` 版本 1.4.5 (2013-3-25) ---------------------- - 再次订正改进内存 BUG,使之极其稳定 - 升级整合最新的 ...