自定义词不支持这样的。这样的在SCWS预处理阶段就已经被分割了。
那些全被视为符号了。。。符号其实是指 词性为 un 的
发布时间:2012-03-06 02:03 t
By coo
你数据库编码问题吧
发布时间:2012-02-24 23:02 t
By 鸭梨山大
应该是你数据源不是utf8的吧
目前没办法。因为我们认为3个字母以上独立成词完全没问题了
发布时间:2013-07-24 14:07 t
By ccxxcc
hightman
可以考虑以后设置个配置项,在一定范围内让用户改配置
...2天在用您的scws lib做开发,
发现scws_set_ignore后,全角的数字会给去掉
再测试了自带的scws程序,加上-I选项后也是同样的,全角字符不显示
下面是我的测试。
[xxxxxx@www etc]$ scws -r rules.utf8.ini -d dict.utf8.xdb -c utf-8 -I
今天花了1...