有没有含有简体中文的gbk规则集文件啊。我在http://www.ftphp.com/scws/download.php#dll处下的文件包括rules.ini rules.utf8.ini rules_cht.utf8.ini 这三个文件,这貌似没有gbk的规则文件吧?但是pscws23只能用gbk。请问这怎么办
hightman, 规则集配置文件的说明文档在哪里? 没有说明文档根本就没有办法是用哪个规则集啊, 很多东西都猜不出来. 停用词怎么添加和使用整了一天了都没搞明白怎么弄. 希望给一份规则集的说明文档, 万分感谢.
pscws23 没有用到规则集,其词典与 scws 也不通用,代码已经弃用并且不维护了,建议不要用。 scws 中的 rules.ini 就是GBK的,
没有找到更新后的 php_scws.dll 文件,请问在哪儿可以下载到最新(1.0.2)的版本? 还有一个问题,就是如何添加修改词库??谢谢
; ; auto regular ; $Id: rules.ini,v 1.3 2007/06/07 08:37:07 hightman Exp $ ; ; special word, 特殊词汇 ; [special] C++ .NET C# R&B S.H.E P&B ; ; nostats ; [nostats] about all also an and any are as at be but by both can for from have here if in is it no ...
... 作为整词而不再是 33.3 和 % 3.修改连字符(-)和下划线(_)的规则,当出现在字母单词之间时视为同一词而不再强行切开,此时如果激活复合分词的 DUALITY 选项,则仍能将符号切开作为复合词。 4.修正浮点数的识别规则,避免将IPv4...