做了个测试,字典只支持一个,能不能支持多个字典? 第一个为预定义的默认字典。其他的以加载顺序做为自定义字典, 先搜索自定义字典。
[quote='hightman' pid='3715' dateline='1284692742'] 哦可能ecshop用的不是GBK的?你下载的默认应该 是gbk 的词典。 [/quote] 谢谢您,已经搞定了……
...令行方式执行的: Notice: Undefined variable: mask in C:\wamp\www\pscws4\etc\xdb.class.php on line 138 Warning: fread() [function.fread]: Length parameter must be greater than 0 in C:\wamp\www\pscws4\etc\xdb.class.php on line 612 Warning: unpack() [function.unpack]: Type I: not enough inpu...
...自己加断点简单调试一下。 [/quote] 我知道,不能用于PSCWS23里的词典。可用于 SCWS-1.x.x 和 PSCWS4. 但是同样是XDB格式,我想导入导出PSCWS23下的XDB词典又怎么办呢?谢谢你的回答和免费提供学习。[hr] SCWS-1.x.x 和 PSCWS4 的分词词典...
HI,hightman $cws = new PSCWS4('utf8'); $cws->set_dict('etc/dict.utf8.xdb'); $cws->set_rule('etc/rules.utf8.ini'); $ret = array(); $ret = $cws->get_tops(10,'r,v,p'); echo "No.\tWord\t\t\tAttr\tTimes\tRank\n------------------------------------------------------\n"; $i = 1; foreach ($ret as $...
$text = "a vnii a"; function get_tags_arr($title){ require 'pscws4/pscws4.class.php'; $cws = new PSCWS4('utf8'); $cws -> set_charset('utf-8'); $cws->set_dict('dict.utf8.xdb'); $cws->set_rule('pscws4/etc/rules.utf8.ini'); $cws->send_text($title); $words = $cws->get_tops(10); $cws->c...
我把从XDB词典文件中下载的GBK格式的词典,放在PSCWS23程序的词典文件中作为默认词典,然后我运行PSCWS23程序的demo文件输入内容后检测结果匹配不到。这是什么原因??:huh: 望各位高手不吝赐教,谢谢
我想对打断的英文做分词,utf-8,scws可以用么?应该下载哪个版本呢?PSCWS4 说是速度慢,不推荐使用,而PSCWS23 仅支持GBK字符集