我下了个PSCWS23 代码并成功安装,结果分词只对汉字有效。我用的其中的pscws3分词。 比如我输入“2009年” 分词结果却为“年”。也就是说,它只输出了汉字部分 请问这该怎么解决
PSCWS23 词典文件如何制作 xdb导入导出工具导出信息如下 ---------------------------------- # WORD TF IDF ATTR ---------------------------------- 除了表头,一个都没导出。。。。。。
...自己加断点简单调试一下。 [/quote] 我知道,不能用于PSCWS23里的词典。可用于 SCWS-1.x.x 和 PSCWS4. 但是同样是XDB格式,我想导入导出PSCWS23下的XDB词典又怎么办呢?谢谢你的回答和免费提供学习。[hr] SCWS-1.x.x 和 PSCWS4 的分词词典...
[quote='hightman' pid='3711' dateline='1284628104'] pscws2,3和scws-的词典不是共用的~~23用里面自带的那个旧词典才行。 [/quote] 我用的就是pscws23-20081221.tar.bz2这个包里边的字典。我单独写一个事例没的乱码,但加入ecshop了就有乱码了。
我把从XDB词典文件中下载的GBK格式的词典,放在PSCWS23程序的词典文件中作为默认词典,然后我运行PSCWS23程序的demo文件输入内容后检测结果匹配不到。这是什么原因??:huh: 望各位高手不吝赐教,谢谢
按“说明”里的方法 ,我在CMD里做了如下输入 ,能运行,但是导不出内容来: 怎么回事呢?能正常运行分词的功能。 F:\phpStudy\PHP5> php F:\www\test\pscws23\XDB-IO\dump_xdb_file.php F:\www\test\pscws23\XDB-IO\dictxdb C:\xx.txt 请教HM,谢谢!
我想对打断的英文做分词,utf-8,scws可以用么?应该下载哪个版本呢?PSCWS4 说是速度慢,不推荐使用,而PSCWS23 仅支持GBK字符集