编码问题找到原因,我使用的是PHP5版本,默认执行了这个构造函数 function __construct() { $this->PSCWS4(); } 导致使用的仍是GBK编码,$cws->set_charset('utf8');一下就可以了。 期待帮忙答复一下第二个问题,谢谢老大。
今天又在网站上重新下载了 简体utf8 xdb字典,和make_xdb 等软件,做次操作, xdb->txt 再txt->xdb 就不行了,直接报错! 麻烦版主测试一下,给一个修改字典的方法,谢谢!
...0 1.0 e 通过:scws_add_dict(s, "/usr/local/scws/etc/userdict.utf8.xdb", SCWS_XDICT_XDB); 结果还是不对。
...s->buf); $tmp['word'] = XS::convert($tmp['word'], self::$_charset, 'UTF-8'); $words[] = $tmp; $res = self::$_server->getRespond(); } return $words;} 获取分词结果 getTokens() 方法 public void getTokens($value, $doc=NULL) $value $doc ...
...ens = array(); $this->setIgnore(true); // save charset, force to use UTF-8 $_charset = self::$_charset; self::$_charset = 'UTF-8'; $words = $this->getResult($value); foreach ($words as $word) { $tokens[] = $word['word']; } // restore charset self::$_charset = $_char...
setUtf8() 方法 public bool setUtf8() {return} bool MySQL 自 4.1.0 起支持字符集 源码: sdk/php/util/XSDataSource.class.php#L534 (显示) public function setUtf8(){ if (version_compare(mysql_get_server_info($this->link), '4.1.0', '>=')) { return @mysql_query("SE...
目前不行。只能自己生成 scws 的词典并放进 $prefix/etc/dict.utf8.xdb 覆盖 词典可以自己先制作TXT格式在利用SCWs提供的工具转换成XDB格式 [url]http://www.hightman.cn/bbs/showthread.php?tid=712[/url] 这个贴子后面有讲到