最近在做个项目,用到了分词,找了一下,发现这个,很好. 遇到一个问题, 命令导出xdb到txt,只导出了这个 # WORD TF IDF ATTR 请问这是咋回事
[quote='hightman' pid='3443' dateline='1267710296'] 现在导出的错误已经得到修正,错误原因在于 Next() 中误把 $this->hash_prime写成了$this->hash_base [/quote] 导出TXT文件顺序是按照XDB里面的排列的 (我觉得导出文件可能有问题) 创建XDB文件是...
现在导出的错误已经得到修正,错误原因在于 Next() 中误把 $this->hash_prime写成了$this->hash_base
[quote='heraldboy' pid='3252' dateline='1247908926'] Notice: Undefined variable: mask in C:\wamp\www\pscws4\etc\xdb.class.php on line 138 Fatal error: Allowed memory size of 1073741824 bytes exhausted (tried to allocate 1642825009 bytes) in C:\wamp\www\pscws4\etc\xdb.class.php on line 638 这...
Notice: Undefined variable: mask in C:\wamp\www\pscws4\etc\xdb.class.php on line 138 Fatal error: Allowed memory size of 1073741824 bytes exhausted (tried to allocate 1642825009 bytes) in C:\wamp\www\pscws4\etc\xdb.class.php on line 638 这两个问题我试过多次,还是有的,麻烦站...
还有就是内存的问题,因为我希望在服务器端有个自动生成词库的功能,命令行方式不是很方便。 主要是用机器先自动分词,人工发现不合理,再把新词增加进去。
我打印了下611行的$rlen的值,发现在32位linux下,出错的时候$rlen的值已经变成了-774261301 这显然不是一个正常的值。 所以程序会报告fread错误,同时也导致了后面的一系列错误!