就一条记录怎么会有4M?如果文件 已存在生成是不会覆盖的啊 你描述的并不是很清楚,你用的是PHP的工具还是C的转换工具呢?一个.TXT对应转换成一个.XDB
命令行方式返回正确 scws 北京大学 -c utf8 -d /usr/local/scws/etc/dict.utf8.xdb -M 3 北京大学 北京 大学
...为什么我导出词库重新生成之后会出一大堆错误,在make_xdb_file.php以下两行出错。 if ($v['part']) $flag |= 0x02; $data = pack('ffCa3', $v['tf'], $v['idf'], $flag, $v['attr']); 我的词库是UTF8的。 我提供一个导出的附件,高手们能否看看。[hr] ...
...='3485' dateline='1270715102'] 自定义可以的,但要用工具 转成XDB的话必须四个字段都齐全。 [/quote] 谢谢老大回答,再问一下,那我其它的属性如何才能得到,比如我的word很多,我能都设置一样的属性吗,这样有什么影响?
$cws = scws_open("gbk"); scws_set_dict($cws, "./etc/dict.xdb"); scws_add_dict($cws, "./etc/s.txt",SCWS_XDICT_TXT); scws_set_rule($cws, "./etc/rules.ini");
scws_set_dict($so, '/dict.utf8.xdb'); scws_set_rule($so, '/rules.utf8.ini'); 问题在这里!!
需要指定词典位置,比如: # scws -A -d /hp/opt/scws/dict/default.utf8.xdb:/home/vanni/scws/mydict.txt -c utf8 "相宜本草洗面奶和雅漾舒护活泉水哪个好" 相宜/a 本草/nz 洗面奶/nz 和/c 雅漾/@ 舒护/@ 活泉水/@ 哪个/r 好/a
[quote='hightman' pid='7092' dateline='1319384262'] 如果你还需要原来的词典,请在 add_dict 前加 set_dict(ini_get('scws.default.fpath').'/dict.utf8.xdb'); [/quote] 是的。这没问题了。是那txt编码问题。不是utf8的话就不行的。 scws我是用utf8。