有没有含有简体中文的gbk规则集文件啊。我在http://www.ftphp.com/scws/download.php#dll处下的文件包括rules.ini rules.utf8.ini rules_cht.utf8.ini 这三个文件,这貌似没有gbk的规则文件吧?但是pscws23只能用gbk。请问这怎么办
...SS__, 'convertOut')); }} 设置输出、输入编码 默认输出的中文编码均为 UTF-8
....5 按照官方文档安装和下载词典,用php扩展测试,无法对中文分词,把词典权限设置为777后依旧不行。 还有其他什么要注意的? 例如: [quote]早春装新款2014大码宽松长款韩版蕾丝衫雪纺衫打底衬衫[/quote] 分词结果: [quote]早春...
嗯 ,确认是用xunsearch是吧?另外请官方明确用中文标示出GPL的版本。 不知道我们是否有权要求761.com开源所有引用了xunsearch的以及相关的源码么?
我电脑APACHE+PHP 4GB内存 E6300处理器 PHP简易中文分词(SCWS) 第4版(GBK) 在我电脑上用你默认的分词内容"陈凯歌并不是..." 第一次0.8xxxs 第二次0.098711013793945 而你们演示的就快多了 0.0039410591125488 为什么差距这么大?
我下了中文分詞系统1.2.2 在linux环境下安装成功了,但是分词时,会被分成一个一个的汗字 比如:我是一个中国人 分词后就变成了:我 是 一 个 中 国 人
...rg,"utf-8"); } return $terms; } hightman可以改成这个,那中文一元切分就也可以了 [hr] 建议:目前开放的都是php api,如果能开放c api和c的一些配置就更好了