如果你了解scws就会知道它其实对散字也是自动二元处理。 你所谓的一元是一个字一个词?你也可以拓展 XSTokenizer 自己实现分词
[quote='bigxu' pid='920' dateline='1339722807'] 只要导入xunsearch数据库,所有搜索都支持 [/quote] 具体代码能share一下么?
好像已经有人做过了,google code 上 Google: python scws 就可以查到了
http://www.ftphp.com/scws/demo/v4.php 在这可以查分词结果 用附带的工具 util/Quest.php 加上 --show-query 可以看实际拆分的语句,这样你就明了了。