[b][size=3]关于 PHP 版简易中文分词[/size][/b] 目前已经发布的PHP版分词有第2版和第3版,这两个版本的用法完全一样,主要区别在于分词的算法,前者采用正向最大匹配2级交叉消岐,而后者采用的是双向匹配综合消岐。并没有绝...
...://bbs.xunsearch.com/showthread.php?tid=1228][b]PHP4版 简易中文分词(PSCWS) 第2/3版[/b][/url] 下载地址:[url=http://www.xunsearch.com/scws/down/pscws23-20081221.tar.bz2]http://www.xunsearch.com/scws/down/pscws23-20081221.tar.bz2[/url] 演示地址:[url=http://www.xunsearch.com/scws/de...
pscws23 没有用到规则集,其词典与 scws 也不通用,代码已经弃用并且不维护了,建议不要用。 scws 中的 rules.ini 就是GBK的,
有没有含有简体中文的gbk规则集文件啊。我在http://www.ftphp.com/scws/download.php#dll处下的文件包括rules.ini rules.utf8.ini rules_cht.utf8.ini 这三个文件,这貌似没有gbk的规则文件吧?但是pscws23只能用gbk。请问这怎么办
...中英夹杂的长词复合分法,比如 "奥迪A6/奥迪/A6" 2) 修正 pscws23 演示文件的一些写法与新版 PHP 不兼容 3) 修正一些 configure 检测错误 [b]scws-1.2.1 发布于 2013-1-15[/b] 1) 将源码迁移并托管到 github 2) 改进 C API 中 scws_fork() 的算法,...