...] => 47.939998626709 [attr] => ns ) ) [b]在XDB词典下是没有问题的。[/b]
多谢建议,这样是否还会转换成需要词典导出的功能了呢,呵呵。只是默认的词库过大,导出其实蛮不方便,还是借助命令行比较好。 等1.1.6估计 会加上这个功能 export_dict(); import_dict() 之类的,直接可以把xdb导出为数组或把...
PHP Fatal error: Allowed memory size of 536870912 bytes exhausted (tried to allocate 1046898225 bytes) in /var/www/html/search/dict/xdb.class.php on line 638 我也碰到同樣的問題,換一台主機依舊有問題 謝謝 ,問題是 638 行 : $rec['value'] = fread($this->fd, $rec['vlen']); ...
[quote='heraldboy' pid='3252' dateline='1247908926'] Notice: Undefined variable: mask in C:\wamp\www\pscws4\etc\xdb.class.php on line 138 Fatal error: Allowed memory size of 1073741824 bytes exhausted (tried to allocate 1642825009 bytes) in C:\wamp\www\pscws4\etc\xdb.class.php on line 638 这...
...有关,这样scws在多线程环境中每一个线程都需要加载load词典,这样势必会浪费很多内存资源,特别是当词典比较大的时候? 能否把只读的词典部分从scws_st结构体中独立出来,这样只需要在主线程中load词典,而其它线程可以...
...不需要更改, 只需要将rules.utf8.ini和dict.utf8.xdb改为繁体的词典即可. 词典制作参见相关代码里的工具 scws-1.0 里包含了词典制作工具. 顺便奉上之前整理制作的繁体数据. [url]http://www.hightman.cn/down/rules_cht.utf8.ini[/url] [url]http://www....
[quote='hightman' pid='3443' dateline='1267710296'] 现在导出的错误已经得到修正,错误原因在于 Next() 中误把 $this->hash_prime写成了$this->hash_base [/quote] 导出TXT文件顺序是按照XDB里面的排列的 (我觉得导出文件可能有问题) 创建XDB文件是...
老大,你提过的词典太老了,很多词语都没有。我想自己扩充我的词库,但不知道TF/IDF如何获得。 通过你提过的新词生词的TF/IDF计算器(http://www.xunsearch.com/scws/demo/get_tfidf.php) 结果计算出来的大部分内容都是一样的值,而...
老大,你提过的词典太老了,很多词语都没有。我想自己扩充我的词库,但不知道TF/IDF如何获得。 通过你提过的新词生词的TF/IDF计算器(http://www.xunsearch.com/scws/demo/get_tfidf.php) 结果计算出来的大部分内容都是一样的值,而...
自定义词库有些词无效。。 有的是3个以上的,有些是4个以上的,不定。。 ubuntu linux环境,自编译安装 比如顶置的例子我这里是这样的 ; dict_extra.txt 我是新增词 2.0 再试一个 1.0 1.0 @ ; 以下词为删除项 删除 ...