...[color=red] [/color][/b] [url=http://bbs.xunsearch.com/showthread.php?tid=1233][b][color=darkgreen]Libscws C API 使用说明[/color][/b][/url][b][color=red] [/color][/b] [url=http://bbs.xunsearch.com/showthread.php?tid=1231][b][color=blue]SCWS-php扩展的说明及用法[/color][/b][/url][b][color=...
http://so.e23.cn 数据量大约为3500万,新闻在50万左右,其它的全部为论坛数据。 新闻一个库,论坛按年份分的库,目前速度感觉可以接受。
pscws23 没有用到规则集,其词典与 scws 也不通用,代码已经弃用并且不维护了,建议不要用。 scws 中的 rules.ini 就是GBK的,
我想对打断的英文做分词,utf-8,scws可以用么?应该下载哪个版本呢?PSCWS4 说是速度慢,不推荐使用,而PSCWS23 仅支持GBK字符集
有没有含有简体中文的gbk规则集文件啊。我在http://www.ftphp.com/scws/download.php#dll处下的文件包括rules.ini rules.utf8.ini rules_cht.utf8.ini 这三个文件,这貌似没有gbk的规则文件吧?但是pscws23只能用gbk。请问这怎么办
我的也无法加载,php版本为5.3. 估计不是路径问题,是php版本问题。感觉现在服务器系统用windows的很多。建议也重视23版的开发和升级,比如加入get_tops等