...class.php#L977 (显示) public function processDoc($doc); 索引文档处理函数 在此通过 XSDocument::addIndex 或 XSDocument::addTerm 做索引相关调整
这个检测是从左往右检测,因为“冰包”不存在,所以后面的餐桌也就不显示了。 这个是处理上的一个隐规则,或许将来会得到改变。
如果你了解scws就会知道它其实对散字也是自动二元处理。 你所谓的一元是一个字一个词?你也可以拓展 XSTokenizer 自己实现分词
建议做个出入库转换,将 +- 加号减号等数学符号转化为特定罕见中文。 如 + -> 枷 - -> 碱 然后在建立索引、处理关键字时做个替换,符号转中文 在呈现给用户时,也做个替换,中文转符号。