那个也不太准,新词你统统设为1就可以了
是不是因为你的源码是UTF-8的?
可以跟据词性在分词后自己过滤
为什么不能定义超过3个中文的词呀。(自定义词典使用的是UTF8格式) 比如我定义 “相宜本草” ,但是没有用!
定义一个自定义词典,包括下面内容: 了 100 100 e 现在 100 100 时间 100 100
scws目前支持带空格的词恐怕有困难
中英混合的词目前最多只支持2个字母
问题以解决 见这里 http://www.hightman.cn/bbs/showthread.php?tid=963&pid=9081#pid9081
-L /usr/local/scws/lib test.c -L后面不要加空格