...gb2312的,但是从 scws 主页上下载词典文件有好几个,dict.utf8.xdb,dict.xdb和dict_cht.utf8.xdb,我可以把这几个都装到etc文件夹里么?还有那几个ini文件也是一样的问题。 我已经在php.ini中这样配置了: extension = php_scws.dll scws.default.ch...
...网站使用了多种开源的系统,有的系统是gbk,有的系统是utf8,为了简单一点实现统一的搜索,所以打算全部的搜索配置都使用utf-8[hr] 很感谢 hightman,很早以前我用了scsw,但是不知道有xunsearch,当时公司使用的是zend lucene和scsw分...
...?[hr] 呃 发现必须的加 -c gbk 由于我使用的putty设置的是utf8的原因, 虽然显示有点不正常,但加上 -c gbk 就可以了
...问题最后我试验了.发现.是由于 词库名字错误.. dict.utf8.xdb 的而我市 dict.xdb 这个就不对了.除非你是gbk 的. 还有就是..我在代码上显式的加载词库.所以也导致词库加载失败 ...十分奇怪.. $so->add_dict(ini_get("scws.default.fpath") . '/...
你默认的字符集是 gbk吧?请在 add_dict 前先调用 $so->set_charset('utf8'); 或者直接用 $so = scws_new('utf8');
编码问题找到原因,我使用的是PHP5版本,默认执行了这个构造函数 function __construct() { $this->PSCWS4(); } 导致使用的仍是GBK编码,$cws->set_charset('utf8');一下就可以了。 期待帮忙答复一下第二个问题,谢谢老大。
...36]本网站的PHP的XDB导入导出工具[/url]作者提供了一个繁体UTF8的,一定要转换为GBK) 注意:: 本程序只支持GBK!!我没有用mbstring进行代码转换的! 如果你是utf8,自己修改程序去吧,也不复杂(utf8的一个汉字是3个字符,记...
...utf-8'); $pscws->set_ignore('yes'); $pscws->set_dict('E:/scws/etc/dict.utf8.xdb'); $pscws->set_rule('E:/scws/etc/rules_cht.utf8.ini'); // 分词调用 send_text() 将待分词的字符串传入, 紧接着循环调用 get_result() 方法取回一系列分好的词 // 直到 get_result() 返...