终于找到一个自动分词系统,由于不能确定服务器是否加载这个分词的dll文件 则使用PSCWS4进行使用 可是pscws4类中并没有add_dict函数 我用set_dict设置自己自定义字典.txt文件 一直报错 这个怎么解决 就是加载自定义的txt字典 thank u
[b][size=3]关于 PHP 版简易中文分词[/size][/b] 目前已经发布的PHP版分词有第2版和第3版,这两个版本的用法完全一样,主要区别在于分词的算法,前者采用正向最大匹配2级交叉消岐,而后者采用的是双向匹配综合消岐。并没有绝...
按“说明”里的方法 ,我在CMD里做了如下输入 ,能运行,但是导不出内容来: 怎么回事呢?能正常运行分词的功能。 F:\phpStudy\PHP5> php F:\www\test\pscws23\XDB-IO\dump_xdb_file.php F:\www\test\pscws23\XDB-IO\dictxdb C:\xx.txt 请教HM,谢谢!
pscws4和scws大致相同的算法,只是后来pscws4没有再进一步更新了。 粗分毕竟只是粗分,要想正式用只用其中一种肯定是不够的。 scws 里面先按逐字把所有可能的词都列出来,建成一个2维表,然后把有岐义的部分拧出来,以其...
Notice: Undefined variable: mask in C:\wamp\www\pscws4\etc\xdb.class.php on line 138 Fatal error: Allowed memory size of 1073741824 bytes exhausted (tried to allocate 1642825009 bytes) in C:\wamp\www\pscws4\etc\xdb.class.php on line 638 这两个问题我试过多次,还是有的,麻烦站...
...2' dateline='1247908926'] Notice: Undefined variable: mask in C:\wamp\www\pscws4\etc\xdb.class.php on line 138 Fatal error: Allowed memory size of 1073741824 bytes exhausted (tried to allocate 1642825009 bytes) in C:\wamp\www\pscws4\etc\xdb.class.php on line 638 这两个问题我试过多次...
[quote='hightman' pid='4112' dateline='1300085069'] 是PSCWS本身慢,要用DLL的才快一些 [/quote] dll也想用不过种种原因的约束所以只能用PSCWS的版本 话说...用官方的xdb比自己创建的xdb快许多...官方那个xdb速度虽然足以...不过没有许多词语.....
...e='1246183006'] 谢谢,我找到了,但是我不懂C,现在用的是PSCWS/4.0,我希望有个PHP的字典格式转换程序,我下午分析了一下你的读取代码,本人水平有限,感觉很难。 如果你能提供一个windows下的可执行程序,或者单独写个PHP程序...
...://bbs.xunsearch.com/showthread.php?tid=1228][b]PHP4版 简易中文分词(PSCWS) 第2/3版[/b][/url] 下载地址:[url=http://www.xunsearch.com/scws/down/pscws23-20081221.tar.bz2]http://www.xunsearch.com/scws/down/pscws23-20081221.tar.bz2[/url] 演示地址:[url=http://www.xunsearch.com/scws/de...