HI,hightman $cws = new PSCWS4('utf8'); $cws->set_dict('etc/dict.utf8.xdb'); $cws->set_rule('etc/rules.utf8.ini'); $ret = array(); $ret = $cws->get_tops(10,'r,v,p'); echo "No.\tWord\t\t\tAttr\tTimes\tRank\n------------------------------------------------------\n"; $i = 1; foreach ($ret as $...
这是我的代码: [php] // 加入头文件 require 'pscws/pscws4.class.php'; header("Content-Type:text/html;charset=utf-8"); // 建立分词类对像, 参数为字符集, 默认为 gbk, 可在后面调用 set_charset 改变 $pscws = new PSCWS4('utf-8'); $pscws->set_ignore('yes'); $psc...
编码问题找到原因,我使用的是PHP5版本,默认执行了这个构造函数 function __construct() { $this->PSCWS4(); } 导致使用的仍是GBK编码,$cws->set_charset('utf8');一下就可以了。 期待帮忙答复一下第二个问题,谢谢老大。
用pscws4分词,为什么只打印出里面的数字,中文直接不分词打印,网页编码是utf8 function get_tags_arr($title){ require 'pscws4/pscws4.class.php'; $pscws = new PSCWS4(); $pscws->set_dict('scws/dict.utf8.xdb'); $pscws->set_rule('scws/rules.utf8.ini'); $pscws->set_ign...
$text = "a vnii a"; function get_tags_arr($title){ require 'pscws4/pscws4.class.php'; $cws = new PSCWS4('utf8'); $cws -> set_charset('utf-8'); $cws->set_dict('dict.utf8.xdb'); $cws->set_rule('pscws4/etc/rules.utf8.ini'); $cws->send_text($title); $words = $cws->get_tops(10); $cws->c...
...里面只有两个文件,而应该是有3个,这个不行就想试试 PSCWS4 结果这里的文件是全的,放到C:\Program Files\scws\etc了就可以了。。。希望hightman把文件补全,郁闷了一天。。。