...,这对我很有帮助。想请教一下如何把0.0.1-pre版本的dict.xdb转换成txt呢?我找到了您发布的scws-v23里面的mk_txt.php,但是好像和新版本的xdb词库不兼容,能否麻烦提供一个txt格式的词库下载?多谢指教。 p.s. 感谢hightman坛主为开...
[quote='hightman' pid='4106' dateline='1299821709'] 是不是你创建的XDB文件没有调用相应的optimize方法 ? php里有一个 $xdb->Optimize(); 这是在创建文件后必须调用的,即使不调用,效率也不会像你描述的这么慢吧。 [/quote] 有运行优化函...
我举个例子吧 下面是用csws分词的结果,明显csws把email,网址给拆开了,还有标签没有去除,但是中文词是正确的分开了 postgres=# SELECT to_tsvector('zw_simple','pgsql中国社区论坛 http://www.pgsqldb.org:8079 chenaishen@263.net'); ...
$so->set_dict('D:\php\scws\etc\dict.utf8.xdb'); $so->set_rule('D:\php\scws\etc\rules.utf8.ini'); $so->add_dict('D:\php\www\htdocs\dict_extra.txt', SCWS_XDICT_TXT); hm你好。 上边的代码的确可以自定义词库,现在的scws能否直接把词加入核心词库了啊?比如直接加...
...以覆盖前面的词库。 参数 mode 包括三个值:SCWS_XDICT_XDB, SCWS_XDICT_MEM, SCWS_XDICT_TXT, TXT意未着 fpath 指向的词库文件为纯文本文件, 可以通过按位与(|)与另2项链接表示是否强制将词库加载到内存. 除TXT外只支持XDB格式的词...
...ght] => 47.939998626709 [attr] => ns ) ) [b]在XDB词典下是没有问题的。[/b]
...以覆盖前面的词库。 参数 mode 包括三个值:SCWS_XDICT_XDB, SCWS_XDICT_MEM, SCWS_XDICT_TXT, TXT意未着 fpath 指向的词库文件为纯文本文件, 可以通过按位与(|)与另2项链接表示是否强制将词库加载到内存. 除TXT外只支持XDB格式的词...
...xhausted (tried to allocate 1046898225 bytes) in /var/www/html/search/dict/xdb.class.php on line 638 我也碰到同樣的問題,換一台主機依舊有問題 謝謝 ,問題是 638 行 : $rec['value'] = fread($this->fd, $rec['vlen']); 不可能超過 1gb 我有看到 gen_dict.c 但是是...
...8'); $this -> so->set_ignore(1); // $this -> so->add_dict('dict.utf8.xdb'); if($this -> so->add_dict('mydict_utf8.txt', SCWS_XDICT_TXT)) { echo 'ok'; } else { echo 'no'; } $this -> so->set_rule('rules.utf8.ini'); } function word_list($text) { ...
... = scws_new(); $cws->set_charset('utf8'); $cws->add_dict(XDB_PATH);//系统默认词库文件地址(xdb格式)[/quote] //$cws->add_dict(XDICT_PATH, SCWS_XDICT_TXT);//我的自定义词库地址 (txt格式) $cws->set_duality(true); $cws->set_ignore...