...so->set_charset('utf8'); $this -> so->set_ignore(1); // $this -> so->add_dict('dict.utf8.xdb'); if($this -> so->add_dict('mydict_utf8.txt', SCWS_XDICT_TXT)) { echo 'ok'; } else { echo 'no'; } $this -> so->set_rule('rules.utf8.ini'); } function word...
...会自动试调用 ini 中指定路径下的词典和规则文件 $so->add_dict(ini_get("scws.default.fpath") . '/dict.utf8.xdb'); $so->add_dict("/usr/myapp/dict_extra.txt",SCWS_XDICT_TXT); $so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); // $so->set_duality(0); $so->set_i...
... $cws = scws_new(); $cws->set_charset('utf8'); $cws->add_dict(XDB_PATH);//系统默认词库文件地址(xdb格式)[/quote] //$cws->add_dict(XDICT_PATH, SCWS_XDICT_TXT);//我的自定义词库地址 (txt格式) $cws->set_duality(true); $cws->s...
...了一个T吧,那个代码反正我试验是错误的! [php] $cws->add_dict(ini_get("scws.default.fpath").'/dict.xdb'); $cws->add_dict("./dict_extra.txt", SCWS_XDICT_TXT); [/php] 在说说词分词测试: 我的网址:http://sjz.haojishu.com/tools/222.php 官方网址:http://www...
恩,我也出现这样的问题,我编码是GBK,加载txt自定义字典后无法取得字典中的内容。 你这种写法txt会把上面的xdb覆盖掉的。 可以使用add_dict增加xdb字典的后面并优先。
终于找到一个自动分词系统,由于不能确定服务器是否加载这个分词的dll文件 则使用PSCWS4进行使用 可是pscws4类中并没有add_dict函数 我用set_dict设置自己自定义字典.txt文件 一直报错 这个怎么解决 就是加载自定义的txt字典 thank u
如果你还需要原来的词典,请在 add_dict 前加 set_dict(ini_get('scws.default.fpath').'/dict.utf8.xdb');
备注,我下载的版本是1.22的 现在的版本还能载入文本文件(txt)么 ,我在调试的过程中发现add_dict() 函数载入xdb文件没有问题,但是载入txt文件就报错,望回答。 备注:老版本的如1.17还有下载么
...完全空缺词库的情况下才自动加载默认词库,只要你曾经add_dict,或set_dict那么就不会加载默认词库了。这并不算BUG吧。 这是给懒人设定的规则,当你试图设置词典时那就完全交给你决定,而不是系统强制无论如何都先加载默认...
应该是分词词典没有正确加载。 如果你在php.ini中没有正确指定路径的话scws.default.fpath以及字符集 scws.default.charset 你应该在分词代码中明确指定这些 $s->add_dict(); 或 $scws->set_dict(); 还有 $scws->set_charset() 应该在此之前调用