...成的xdb格式词典的大小是438286字节,etc/dict_chs_gbk.txt这个文件有284726行,在里边查找,能找到“中国”这些关键词!
....sqlite是词库的名称 参数第二个 dict.txt是输入词库的文本文件(本网站[url=http://www.hightman.cn/bbs/showthread.php?tid=636]本网站的PHP的XDB导入导出工具[/url]作者提供了一个繁体UTF8的,一定要转换为GBK) 注意:: 本程序只支持GBK!!...
...长词复合分法,比如 "奥迪A6/奥迪/A6" 2) 修正 pscws23 演示文件的一些写法与新版 PHP 不兼容 3) 修正一些 configure 检测错误 [b]scws-1.2.1 发布于 2013-1-15[/b] 1) 将源码迁移并托管到 github 2) 改进 C API 中 scws_fork() 的算法,使之更为合...
...] 这样的错误可能是运行的平台的字节序不一样或者.xdb文件已损坏所导致的. 我发一份我这边正确导出的词库吧.(你可以从附件处下载) 而对于其中的 TF / IDF 则相应的表示该词的词频率系统以及逆词频率(表示词重要性), 你可...
...我该怎么做?谢谢了。 啊,搞定了。原来是下载规则集文件的时候里面只有两个文件,而应该是有3个,这个不行就想试试 PSCWS4 结果这里的文件是全的,放到C:\Program Files\scws\etc了就可以了。。。希望hightman把文件补全,郁闷了...
...eight']); } $cws->close(); utf8编码好像使用不了,我把所有文件(ini,php,包括test.php)都改成utf8编码存储,header输出的也是utf8编码,执行默认的test.php,产生乱码,不知道问题出现在哪?dict.utf8.xdb是新下载的没有动,非常感谢。 另...
是你的.txt文件不规范吗,为什么会报不存在['tf'] & ['idf'] 啊 phptool for xdb 有最新版啊,建议下载最新的:http://www.ftphp.com/scws/download.php#xtools
我把php_scws.dll放在php的扩展目录了,也下载了以下三个文件放在D:/PHP/SCWS/里面 dict.utf8.xdb rules.ini rules.utf8.ini rules_cht.utf8.ini 然后在php里也由设置了 [scws] extension=php_scws.dll scws.default.charset=utf8 scws.default.fpath="D:/PHP/scws" 但是...
...) 下面这些我也都照做了。 建立一个本地目录放规则集文件和词典文件,建议使用:C:/program files/scws/etc 从 scws 主页上下载词典文件,解压后将 *.xdb 放到上述目录中 词典系列:http://www.ftphp.com/scws/down/scws-dict-chs-gbk.tar.bz2 ...
...再细述, 详细情请下载整个软件包以后阅读其中的 README 文件. 最新下载地址: [url=http://www.ftphp.com/scws/down/scws-1.1.0.tar.bz2]http://www.ftphp.com/scws/down/scws-1.1.0.tar.bz2[/url] (共3.0MB) 演示地址: G B K: [url=http://www.ftphp.com/scws/demo/v4.php][col...