...合我们做地址的分词,能不能给个办法将文本的转为dict.xdb格式,看到你在论坛中回复提到一个转换程序,但我不知道在哪里下载。 先谢谢你。[hr] 我们系统对速度要求不高,关键是分词效果,没有字典很难办。
最近在做个项目,用到了分词,找了一下,发现这个,很好. 遇到一个问题, 命令导出xdb到txt,只导出了这个 # WORD TF IDF ATTR 请问这是咋回事
是不是你创建的XDB文件没有调用相应的optimize方法 ? php里有一个 $xdb->Optimize(); 这是在创建文件后必须调用的,即使不调用,效率也不会像你描述的这么慢吧。
那不会吧,PHP的错误日志有没有呢。。。这个脚本对我自己也没用,你或许应该参见一下帮助,是否字符集正确?用法参数是否正确,实在不行自己加断点简单调试一下。
[quote='hightman' pid='4060' dateline='1296558618'] 少量加几个不需要优化。。。。甚至加千把个万把个也可以不优化呵。 可以等待到比较稳定时再集中优化一次。 [/quote] 好的谢谢!
原随 scws 一起发布的简体中文 xdb 词典存在部分问题,导致一些冷僻汉字不能做到散字自动二元,甚至被当做标点符号清除。 现已更新词典,修正该问题,强烈建议重新下载新词典。下载地址: [URL]http://www.ftphp.com/scws/download....
...: Undefined index: part in C:\Users\Administrator\Desktop\tool\dev\ma ke_xdb_file.php on line 92 Notice: Use of undefined constant key - assumed 'key' in C:\Users\Administrato Desktop\tool\dev\xdb.class.php(447) : runtime-created function on line 1 PHP Notice: Use of undefined constant key -...