...。ERROR: output xdb file exists:后面是文件名 是从网站上面下载的XDB导入导出工具 起初我以为是我改的txt格式不对还是怎么的 后来我直接将xdb导出成txt,如下 php E:\www\dump_xdb_file.php E:\www\dict.xdb E:\www\1.txt 成功导出之后,不做任...
...麻烦你下啦。 我的网站是gb2312的,但是从 scws 主页上下载词典文件有好几个,dict.utf8.xdb,dict.xdb和dict_cht.utf8.xdb,我可以把这几个都装到etc文件夹里么?还有那几个ini文件也是一样的问题。 我已经在php.ini中这样配置了: exte...
$hdr['fsize'] 是从 XDB 的头部 unpack 出来的,可能 xdb 文件损坏了,PSCWS4的XDB文件必须和SCWS一样,从 www.ftphp.com/scws/ 下载
...dll c调用的那种 于是就这样我用小工具创建的XDB比官方下载的分词速度慢 演示版的那个分词 0.06s 用我创建的XDB就到 0.09-0.1s了 我觉得比较奇怪~~ 一切都是按说明操作的 还有xdb没有增加新的词语和减少词语用的官方XDB导出...
...个字段之间用\t隔开。 --- hightman 特别制作于 2009.7.1 下载地址:http://www.ftphp.com/scws 或 www.hightman.cn/bbs 的 scws 版
1. 多一个T是哪儿,我没看明白。 2. 你的错误是因为你用错误词了,48.php 是针对UTF-8的,而你调用了gbk的词典,把你的词典语句改为 dict.utf8.xdb 即可 3. dict_extra.txt 也必须是UTF-8编码 4. 删除词条,因为陈凯歌其实可能是因为人...
...新版本的xdb词库不兼容,能否麻烦提供一个txt格式的词库下载?多谢指教。 p.s. 感谢hightman坛主为开源事业所做出的杰出努力,现在网上发布的种种分词工具,绝大部分都只提供了控件或者插件而不直接提供源代码和分词词库...
备注,我下载的版本是1.22的 现在的版本还能载入文本文件(txt)么 ,我在调试的过程中发现add_dict() 函数载入xdb文件没有问题,但是载入txt文件就报错,望回答。 备注:老版本的如1.17还有下载么
...里呢? 上边指定的词库也是UTF8啊 您能否提供完整实例下载呢,直接查看您源码就是乱码,我要右键选择编码,完后复制的![hr] extension = scws.so scws.default.charset = utf8 scws.default.fpath = /usr/local/scws/etc
...的. 我发一份我这边正确导出的词库吧.(你可以从附件处下载) 而对于其中的 TF / IDF 则相应的表示该词的词频率系统以及逆词频率(表示词重要性), 你可以参考现有的词造一个系数. 而词性标注请看这篇: http://www.hightman.cn/bbs/sho...