..._rule('D:/Program Files/scws/etc/rules.utf8.ini'); //注意路径 $cws->set_dict('D:/Program Files/scws/etc/dict.utf8.xdb'); $cws->add_dict(ROOT_PATH."inc/spider/dict_extra.txt", SCWS_XDICT_TXT);//新增词库 $cws->set_ignore(true); //var_dump($cws); //添加中文分词 $cws->sen...
...是。。再这样,先添加原有的词库 $scws = scws_new(); $scws->set_dict("/path/to/dict.utf8.xdb"); $scws->add_dict("/path/to/dict",SCWS_XDICT_XDB); 这样, 原有的词库有了。。自定义的又没了。。都使用add_dict也不行, 如果手动添加词库, 自定义的就没...
...xt') !== false ? SCWS_XDICT_TXT : SCWS_XDICT_XDB; } $this->_setting['set_dict'] = new XSCommand(XS_CMD_SEARCH_SCWS_SET, XS_CMD_SCWS_SET_DICT, $mode, $fpath); unset($this->_setting['add_dict']); return $this;} 设置分词词典, 支持 TXT/XDB 格式
[code] use Text::Scws; my $scws = Text::Scws->new; $scws->set_dict('dict.xdb'); $scws->set_rule('rule.ini'); $scws->set_ignore(1); $scws->set_multi(1); my $s = shift; $scws->send_text($s); while (my $r = $scws->get_result()) { foreach (@$r) { print $_->{word}, " "; } } ...
...一下说明吧. 我不清楚你用的是什么方式,是PHP还是c的API, set_dict 时的第二参数可以指定将词典读入内存的.
...; $pscws->set_debug($debug); $pscws->set_statistics($stats); $pscws->set_dict($dict); //-------这句出现乱码 if (!is_null($textdata)) { $textdata = trim($textdata); } $arr = $pscws->segment($textdata); 乱码信息如下: ����ļ�·����./pscws3/di...
... 忘记说了,我用的编码都是utf8 还有就是如果我用 $so->set_dict('C:/Program Files/scws/etc/dict.xdb'); $so->set_rule('C:/Program Files/scws/etc/rules.utf8.ini'); 就会有警告: Warning: SimpleCWS::set_dict() [function.SimpleCWS-set-dict]: open_basedir restriction in effect...
...,你说该怎么设? 此外 $so = scws_new 怎么可以再用 scws_set_dict 呢?应该用 $so->set_dict(), 类运用和函数运用不要混合着乱用!!多看帮助说明上的例子,不懂不要改先就照抄。
...写出来作参考,把下面的文字存成dict.txt,然后在原有的set_dict之后加上 scws_add_dict(s, 'path/to/this_ad_dict.txt', SCWS_XDICT_TXT); 这样使文本词典生效. 其中词典格式为 词 tf idf attr (当attr为!表示删除该词) [code] 市廛 1 1 ! 河华 1 1 ! 阳道 1...
...一下说明吧. 我不清楚你用的是什么方式,是PHP还是c的API, set_dict 时的第二参数可以指定将词典读入内存的. [/quote] 安装了apache扩展,使用PHP进行调用,也可以设置读入内存? 如果可以的话,每次分词还要设置词典么?