pscws23 没有用到规则集,其词典与 scws 也不通用,代码已经弃用并且不维护了,建议不要用。 scws 中的 rules.ini 就是GBK的,
有没有含有简体中文的gbk规则集文件啊。我在http://www.ftphp.com/scws/download.php#dll处下的文件包括rules.ini rules.utf8.ini rules_cht.utf8.ini 这三个文件,这貌似没有gbk的规则文件吧?但是pscws23只能用gbk。请问这怎么办
$hdr['fsize'] 是从 XDB 的头部 unpack 出来的,可能 xdb 文件损坏了,PSCWS4的XDB文件必须和SCWS一样,从 www.ftphp.com/scws/ 下载
...t_tops的时候设定 可选择去掉英文属性分词 如下:$tops = $pscws->get_tops(10, '');
我安装了PSCWS4,然后再Windows上可以顺利运行,但是分词成功率极低,比如输入: “中国航天官员应邀到美国与太空总署官员开会 发展中国家 上海大学城书店 ” 返回的是: “中 国 航 天 官员应 官员 员应 邀 到 美 国 ...
谢谢,我找到了,但是我不懂C,现在用的是PSCWS/4.0,我希望有个PHP的字典格式转换程序,我下午分析了一下你的读取代码,本人水平有限,感觉很难。 如果你能提供一个windows下的可执行程序,或者单独写个PHP程序就更好了,希...
... 最大概率法 最短路径法 未登录词识别方法 等等 我下PSCWS4,学习了好久算法,由于个人水平还有限,很多地方都不理解,问下你使用的分词方法是基于词典的哪种?能不能给我阐述下,技术的思想呢? 我的要求比较强求,...
...[/quote] 有运行优化函数~ 系统是XP (啪 APACHE 然后用的PSCWS4不是dll c调用的那种 于是就这样我用小工具创建的XDB比官方下载的分词速度慢 演示版的那个分词 0.06s 用我创建的XDB就到 0.09-0.1s了 我觉得比较奇怪~~ 一切都是按...