调整了跟包一起的 etc/rules.ini etc/rules.utf8.ini etc/rules_cht.utf8.ini ,让规则语法匹配更加准确。 建议同步更新~~
...);”这一句后面再补上两句(参考GBK版本): $cws->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); $cws->set_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb'); 再次运行,分词正确了[hr] 不过,又出现了奇怪的问题,我在原来的测试文本后...
...给出 的参数是项目名则自动使用 `$prefix/sdk/php/app/项目名.ini`,例子代码如下: ~~~ [php] require_once '$prefix/sdk/php/lib/XS.php'; $xs = new XS('demo'); // 自动使用 $prefix/sdk/php/app/demo.ini 作项目配置文件 $xs = new XS('/path/to/demo.ini'); // 使用 /path/to...
多谢,此问题源于 rules.ini 中的词性修正。当初把单个字的动词+名词重点提升了权重。 参见这贴子:http://www.hightman.cn/bbs/showthread.php?tid=575&page=1&highlight=hightman#pid3092 当初解决”结合成分子时“ ”学人家人肉“ 。。 之类,所...
...e='1377142375'] 项目名称不对吧,确定存在 ../app/torrentkittys.ini ? 如果不确定就把ini文件的路径打全! [/quote] 我是这样弄的 php的 safe_mode=On safe_mode_include_dir = /usr/local/xunsearch/sdk/php/lib/ 这样require './XS.php'; 会报错 Fatal error: ...
...下载了以下三个文件放在D:/PHP/SCWS/里面 dict.utf8.xdb rules.ini rules.utf8.ini rules_cht.utf8.ini 然后在php里也由设置了 [scws] extension=php_scws.dll scws.default.charset=utf8 scws.default.fpath="D:/PHP/scws" 但是在phpinfo()里找不到scws的信息,而且scws_n...
...ction connect($param){ $host = isset($param['host']) ? $param['host'] : ini_get('mysql.default_host'); $host .= (isset($param['port']) && $param['port'] != 3306) ? ':' . $param['port'] : ''; $user = isset($param['user']) ? $param['user'] : ini_get('mysql.default_user'); $pass = isset($pa...
...是艺术,还是恶俗?大家怎么看的?” 没有加上rule.utf8.ini时,得到如下结果 情歌/n 接龙/n 大/a 串烧/v ,/un 情人节/t 好/a 礼/n 多多/z 武松/nr 杀/v 嫂/ng 雕塑/n 是/v 艺术/n ,/un 还是/n 恶俗/n ?/un 大家/r 怎么/r 看/v 的/uj ?/un 当...
...求实现一个方法 [XSTokenizer::getTokens], 自定义分词器用于 INI 配置文件中的 `tokenizer` 选项。 关于自定义分词器的详细用法剖析请阅读后面的[专题](ini.tokenizer)。 $Id$
打包的时候少了rules_cht.utf8.ini 的原因呵,问题不大,自己touch一个或从rules.ini转换一个 现下载包已经更新并包含了该文件