[size=6]强烈要求 老大 ,把 UTF8 的词库制作方法[/size] [size=6][/size] [size=6]或者 把 词库 GBK 转 UTF8 的方法贴 出来[/size] [size=6][/size] [size=6]不然老是不会用啊。。[/size]
自定义词库加载不上,是什么原因呢? $cws = scws_new(); $cws->set_charset('utf8'); $cws->set_dict('/usr/local/scws/etc/dict.utf8.xdb'); $cws->set_dict(BASE_PATH.'admin/data/dict/wo.txt',SCWS_XDICT_TXT);
有没有含有简体中文的gbk规则集文件啊。我在http://www.ftphp.com/scws/download.php#dll处下的文件包括rules.ini rules.utf8.ini rules_cht.utf8.ini 这三个文件,这貌似没有gbk的规则文件吧?但是pscws23只能用gbk。请问这怎么办
php.in 的配置 [scws] extension=php_scws.dll scws.default.charset = utf8 scws.default.fpath = "e:/soft/xunsearch/scws" e:/soft/xunsearch/scws目录下的文件: dict.utf8.xdb rules.ini rules.utf8.ini rules_cht.utf8.ini 重新启动apache发现已经启动了这个extention. php 代...
...有乱码。是否您的 MYSQL 不支持字符集呢 1.mysql的字符集是UTF8 我连接进去查看 数据都没问题 如果方便自己改一下 Indexer.php 在 $index->update 之前打印一样 $data 的字段。 2.$data 之前的数据中文乱码 您使用哪个方式的 MYSQL 访问方式...
# mydict_utf8.txt 我是新增词 爆红 再试一个 [php] $text = '最近撑腰体爆红网络我是新增词再试一个'; class scws { public $so; function get_microtime() { list($usec, $sec) = explode(' ', microtime()); return ((float)$usec + (float)$sec); } ...
...只打印出里面的数字,中文直接不分词打印,网页编码是utf8 function get_tags_arr($title){ require 'pscws4/pscws4.class.php'; $pscws = new PSCWS4(); $pscws->set_dict('scws/dict.utf8.xdb'); $pscws->set_rule('scws/rules.utf8.ini'); $pscws->set_ignore(true); $pscws->send_te...
...ags_arr($title){ require 'pscws4/pscws4.class.php'; $cws = new PSCWS4('utf8'); $cws -> set_charset('utf-8'); $cws->set_dict('dict.utf8.xdb'); $cws->set_rule('pscws4/etc/rules.utf8.ini'); $cws->send_text($title); $words = $cws->get_tops(10); $cws->close(); $tags = array(); foreac...
....ini 是这样的配置 [scws] extension=scws.so scws.default.charset=utf8 scws.default.fpath=/usr/local/scws/etc 而php 是这样 //分词 $so = scws_new(); $so->set_charset('utf8'); // 这里没有调用 set_dict 和 set_rule 系统会自动试调用 ini 中指定路径下的词...
$so->set_dict('D:\php\scws\etc\dict.utf8.xdb'); $so->set_rule('D:\php\scws\etc\rules.utf8.ini'); $so->add_dict('D:\php\www\htdocs\dict_extra.txt', SCWS_XDICT_TXT); hm你好。 上边的代码的确可以自定义词库,现在的scws能否直接把词加入核心词库了啊?比如直接加...