在另一帖子中回复您的,我猜测是您的 scws 对像字符集没有正确指出,而 php.ini 默认设为 gbk导致,建议显式地指定字符集 $so = scws_new('utf8'); 或在任何 add_dict 之前调用 set_charset
写了一行脚本,将代码转为 UTF-8 编码的源文件: #!/bin/bash for i in `find ./ -type f |grep -v 'batch' ` ; do iconv $i -f gbk -t utf8 -o ${i}.tmp && mv ${i}.tmp $i ; done
...词典,和转化为 xdb 的工具, 词典编码为 gbk, 将 gbk 转换成 utf8 应该非常简单了, 这里不再细述, 详细情请下载整个软件包以后阅读其中的 README 文件. 最新下载地址: [url=http://www.ftphp.com/scws/down/scws-1.1.0.tar.bz2]http://www.ftphp.com/scws/down...
...回的; charset 是要新设定的字符集,目前只支持 utf8 和 gbk。(注:utf8不要写成utf-8) [color=#0000ff]bool scws_set_dict(resource scws_handle, string dict_path)[/color] 说明:设定分词所用的词典。 返回:成功返回 true 失败返回 false 参...
...不能告诉我哪里做错了呢? 忘记说了,我用的编码都是utf8 还有就是如果我用 $so->set_dict('C:/Program Files/scws/etc/dict.xdb'); $so->set_rule('C:/Program Files/scws/etc/rules.utf8.ini'); 就会有警告: Warning: SimpleCWS::set_dict() [function.SimpleCWS-set-dict]...
... 扩展) 默认是处理 gbk 编码的文本,如果你的文本是 utf8,则需要修改该程序的第一行,把 define('IS_UTF8_TXT', false); 改为 true php make_xdb_file.php [导入的文本文件] --- 关于文本文件的说明,每行一条记录,#开头表示...
...pe = numeric index = self 另 1.$doc->from 取值也是乱,不是gbk或utf8的问题 2. setQuery($keyword) 里面的keyword不为空时,是不会出现乱码的
... unsigned NOT NULL, PRIMARY KEY (`id`) ) ENGINE=MyISAM DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ; -- -- Dumping data for table `sample` -- [/code] 新建一个数据表,crontab: [code]-- -- Table structure for table `crontab` -- CREATE TABLE IF NOT EXISTS `crontab` ( `id` int(...
...情况下会自动搜索 ini(scws.default.fpath) 底下的 dict.xdb/dict.utf8.xdb,如果调用过 add_dict 或 set_dict 则不会再触发该功能,故采用额外词库时原核心词库必须显式地调用才行。 -- [color]新功能用法示例[/color] (php为例) -- 1. 自定义...
...情况下会自动搜索 ini(scws.default.fpath) 底下的 dict.xdb/dict.utf8.xdb,如果调用过 add_dict 或 set_dict 则不会再触发该功能,故采用额外词库时原核心词库必须显式地调用才行。 -- [color]新功能用法示例[/color] (php为例) -- 1. 自定义...