...de #include #include int main(int argc, char *argv[]) { scws_t s; scws_res_t res, cur; char *text;// = "Hello, 我名字叫李那曲是一个中国人, 我有时买Q币来玩, 我还听说过C#语言"; text = "我是一名中国的程序员"; ...
scws_set_dict($so, '/dict.utf8.xdb'); scws_set_rule($so, '/rules.utf8.ini'); 问题在这里!!
前几天在一台32位的linux上成功安装了scws 1.1.1版本,今天看到发布了1.1.2的版本,就在一台64位的机器上准备安装。依然遵循1.1.1版本的安装步骤,却发现出错了: 看代码: [code] [root@localhost phpext]# ./configure --with-scws=/usr/local/scws...
[url=http://www.yanbin.org/download/scws-0.0.1-pre_win32_php-4.4.x.zip][color=#810081]点击下载 SCWS 扩展 PHP 4.4.x 版二进制文件[/color][/url] [url=http://www.yanbin.org/download/scws-0.0.1-pre_win32_php-5.2.x.zip][color=#810081]点击下载 SCWS 扩展 PHP 5.2.x 版二进制文件[/colo...
好像已经有人做过了,google code 上 Google: python scws 就可以查到了
... [root@64646155 phpext]# make && make install /bin/sh /niran/fenci/scws/phpext/libtool --mode=compile cc -I. -I/niran/fenci/scws/phpext -DPHP_ATOM_INC -I/niran/fenci/scws/phpext/include -I/niran/fenci/scws/phpext/main -I/niran/fenci/scws/phpext -I/usr/local/php/include/php -I/usr/local/php/in...
在使用scws分词的时候,如果输入40多个“卡”字,最后分出来的那个词少了一个字节,就是说在utf8下原本3字节的一个“卡”字,变成了两个字节,形成了一个乱码。在线测试也会出现这种情况,大家怎么解决啊???
我想对打断的英文做分词,utf-8,scws可以用么?应该下载哪个版本呢?PSCWS4 说是速度慢,不推荐使用,而PSCWS23 仅支持GBK字符集
词库没有正确加载,你检查一下 /usr/local/scws/etc/ 下的 .xdb 的文件属性,默认.tar.bz2 解开有可能是600,建议 chmod a+r /usr/local/scws/etc/*