...返回)。求过滤方案。 $sh = scws_open(); scws_set_charset($sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_set_rule($sh, './rules.ini');//文件内容为空 $cutword = $_POST['cutword']; scws_send_text($sh, $cutword); $rs = scws_get_tops($sh, 5); 另:我使用...
...le规则文件就可以了 $cws->set_dict('/usr/local/scws/etc/dict_chs_utf8.xdb'); $cws->set_rule('/usr/local/scws/etc/rules.utf8.ini');
发贴可以发了,之前为了挡垃圾贴搞错了。 我看你代码用的 dict.xdb 那么为何又用 rules.utf8.ini ?
...)。求过滤方案。 $sh = scws_open(); scws_set_charset($sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_set_rule($sh, './rules.ini');//文件内容为空 $cutword = $_POST['cutword']; scws_send_text($sh, $cutword); $rs = scws_get_tops($sh, 5); 另:我使用工...
..., 必须: $so = scws_new(); $so->add_dict(LIB_DIR.'/scws/ext/dict.utf8.xdb');[b]//这里阿。。[/b] $so->add_dict(LIB_DIR.'/scws/phptool/dels.txt', SCWS_XDICT_TXT); $so->send_text($str); $sk = $so->get_result();
...et){ self::$_charset = strtoupper($charset); if (self::$_charset == 'UTF8') { self::$_charset = 'UTF-8'; } return $this;} 设置字符集 默认字符集是 UTF-8, 这是指 getResult 系列函数的 $text 参数的字符集 setDict() 方法 public XSTokenizerScws se...
...情况下会自动搜索 ini(scws.default.fpath) 底下的 dict.xdb/dict.utf8.xdb,如果调用过 add_dict 或 set_dict 则不会再触发该功能,故采用额外词库时原核心词库必须显式地调用才行。 -- [color]新功能用法示例[/color] (php为例) -- 1. 自定义...
...词典,和转化为 xdb 的工具, 词典编码为 gbk, 将 gbk 转换成 utf8 应该非常简单了, 这里不再细述, 详细情请下载整个软件包以后阅读其中的 README 文件. 最新下载地址: [url=http://www.ftphp.com/scws/down/scws-1.1.0.tar.bz2]http://www.ftphp.com/scws/down...
...回的; charset 是要新设定的字符集,目前只支持 utf8 和 gbk。(注:utf8不要写成utf-8) [color=#0000ff]bool scws_set_dict(resource scws_handle, string dict_path)[/color] 说明:设定分词所用的词典。 返回:成功返回 true 失败返回 false 参...