在提供的文档中,几乎没有发现对rules.ini如何使用的介绍。是否有相关的文档能介绍一下呢? 例如我在ini中看到areaname的配置,这个配置是起什么作用呢?不解。盼高人解疑,谢谢!
...来比较复杂,而且多数用不到,所以一直缺这个文档。 rules.ini 是一个规则,比如像姓名或路名或章节数字之类,可以规定某些字凑在一起就视为整体,可以规定某些字开头或某些字结尾的N个字组成词组,基本上就是这样子。 ...
我用editplus把词典和rule转码后似乎不行啊,,,求大侠提供一下:lol :kiss:
...$so->add_dict(ini_get("scws.default.fpath") . '/dict.utf8.xdb'); $so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); 那么就分词正常. 这个是第一个问题. 第二个问题就是,定义自定义的词典. 看到说1.1.2 支持自定义的 txt 字典.于是我就这...
有没有含有简体中文的gbk规则集文件啊。我在http://www.ftphp.com/scws/download.php#dll处下的文件包括rules.ini rules.utf8.ini rules_cht.utf8.ini 这三个文件,这貌似没有gbk的规则文件吧?但是pscws23只能用gbk。请问这怎么办
程序里面调用set_rule("d:\rule.ini"); 但是就算用从网站下载的rule文件,也还是报“Failed to load the ruleset file”。 怎么回事?
调整了跟包一起的 etc/rules.ini etc/rules.utf8.ini etc/rules_cht.utf8.ini ,让规则语法匹配更加准确。 建议同步更新~~
多谢,此问题源于 rules.ini 中的词性修正。当初把单个字的动词+名词重点提升了权重。 参见这贴子:http://www.hightman.cn/bbs/showthread.php?tid=575&page=1&highlight=hightman#pid3092 当初解决”结合成分子时“ ”学人家人肉“ 。。 之类,所...
...tc/dict.xdb"); scws_add_dict($cws, "./etc/s.txt",SCWS_XDICT_TXT); scws_set_rule($cws, "./etc/rules.ini"); ---- 推荐采用类对像访问方式 $cws = scws_new("gbk"); $cws->set_dict('etc/dict.xdb'); $cws->add_dict('etc/s.txt', SCWS_XDICT_TXT); $cws->set_rule('etc/rules.ini'); ...