1。1。7版,在调用add_dict,添加一个额外的字典前,必须显式调用原词典。 如: 通常: $so = scws_new(); $so->add_dict(LIB_DIR.'/scws/phptool/dels.txt', SCWS_XDICT_TXT); $so->send_text($str); $sk = $so->get_result(); 这样,会得不到增加词库的效果,...
我在分词中没加$so->add_dict("dict.xdb",SCWS_XDICT_XDB); $so->add_dict("dict.txt",SCWS_XDICT_TXT); 这个情况下“云计算”分词如下:"云 计算"。我加了$so->add_dict("dict.xdb",SCWS_XDICT_XDB); $so->add_dict("dict.txt",SCWS_XDICT_TXT); 并在txt文件中加入 “...
这怎么是BUG呢,本来就是这样。只不过是在你没有任何词典的情况下它才默认加载默认词典。 并不是一开始就自动加载默认词典。。。
使用自定义的文本字库, $scws = scws_new(); $scws->add_dict("/path/to/dict",SCWS_XDICT_TXT); 自定义的词库可以使用了, 可是原有的词库就没了。。。 于是。。再这样,先添加原有的词库 $scws = scws_new(); $scws->set_dict("/path/to/dict.utf8.xdb"); $scws->...
很简单啊,根据先 add_dict 后生效的原则,你把自定义的放后在。 $scws->add_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb'); $scws->add_dict('/path/to/dict.self.txt', SCWS_XDICT_TXT); 那么就是后面的 dict.self.txt 优先查询,如果 dict.self.txt 中不存在...
...lse ? SCWS_XDICT_TXT : SCWS_XDICT_XDB; } if (!isset($this->_setting['add_dict'])) { $this->_setting['add_dict'] = array(); } $this->_setting['add_dict'][] = new XSCommand(XS_CMD_SEARCH_SCWS_SET, XS_CMD_SCWS_ADD_DICT, $mode, $fpath); return $this;} 添加分词词典, 支持...
...也没有、添加个别词两种情况); $so = scws_new(); //$so->add_dict('', SCWS_XDICT_TXT); $so->send_text('广州建筑工程监理有限公司中山分公司'); $sk = $so->get_result(); 结果是:广州建筑工程监理有限公司 中山 分公司 $so = scws_new(); $so->a...
....1.2 php 以扩展形式安装 . 如果我不显式的定义 $so->add_dict(ini_get("scws.default.fpath") . '/dict.utf8.xdb'); $so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); 那么就分词正常. 这个是第一个问题. 第二个问题就是,定义自定义的词...
...时请显式地先指定 xdb 词典,以便 txt 词典后生效。 $so->add_dict('dict.xdb', SCWS_XDICT_XDB); $so->add_dict('dict.txt', SCWS_XDICT_TXT); [color=red]$so->set_multi(3);[/color] .. 这样将会得到”云计算“”云计“”计算“
能否试试打印 add_dict 的返回值,在异常的时候看看是不是 true~ 看了你的贴子我特地再做了一翻测试,add_dict,无没问题。我的相关代码及设置: 1. php.ini的设置 [code] [hightman@d1 hightman]$ php -i | grep scws scws SCWS BugReport => http://w...