规则倒是可以匹配,rules.utf8.ini没有问题,但dict.utf8.xdb怎么也转换不过来 版主可有什么办法?
我根据论坛和ftphp网站上要求,在自己的服务器上配置SCWS,但始终无法分词。 我需要的是utf8编码的。 测试文件在gbk下好使,应该如何改成utf8格式的? 请教管理员,我该如何操作。 :huh:
...自己的服务器上配置SCWS,但始终无法分词。 我需要的是utf8编码的。 测试文件在gbk下好使,应该如何改成utf8格式的? 请教管理员,我该如何操作。 :huh: [/quote] 你要注意的是 一些文件里面的 编码设置
HI,hightman $cws = new PSCWS4('utf8'); $cws->set_dict('etc/dict.utf8.xdb'); $cws->set_rule('etc/rules.utf8.ini'); $ret = array(); $ret = $cws->get_tops(10,'r,v,p'); echo "No.\tWord\t\t\tAttr\tTimes\tRank\n------------------------------------------------------\n"; $i = 1; foreach ($ret as $...
文件里的编码转换我已经换成utf8的了,调用文件也对应上了,还是不行。 文件自身的编码需要转换吗?
请问hightman或群里的高人,php(utf8编码)PSCWS v4.0 是目前最新的版本吗? 官方说PSCWS v4.0这个版本速度较慢,但我的是utf-8编码,而且是虚拟主机,除了这个还能更好的版本可以使用吗? 求推荐和指点,谢谢了! [color=#006...
请问hightman或群里的高人,php(utf8编码)PSCWS v4.0 是目前最新的版本吗? 官方说PSCWS v4.0这个版本速度较慢,但我的是utf-8编码,而且是虚拟主机,除了这个还能更好的版本可以使用吗? 求推荐和指点,谢谢了! [color=#006...
...emo/scws/v48.cht.php[/url] 引擎本身不需要更改, 只需要将rules.utf8.ini和dict.utf8.xdb改为繁体的词典即可. 词典制作参见相关代码里的工具 scws-1.0 里包含了词典制作工具. 顺便奉上之前整理制作的繁体数据. [url]http://www.hightman.cn/down/ru...