要命了,管理员请指点: linux命令行执行: scws 北京大学 -c utf8 -d /usr/local/scws/etc/dict.utf8.xdb -M 3 返回: 北京大学 北京 大学 php调用system执行同样的命令,返回4个单字。
是不是你的 TXT 文件有问题,比如编码方面。TXT的资源指定成XDB肯定要出错啊
...,生成后有4M, 第二次: 积分 20.0 20.0 @ 用的是原dict.xdb导出txt后的格式,生成后有10M, 为什么相差这么多呢?
... php调用时, $so->set_dict(ini_get("scws.default.fpath")."/dict.utf8.xdb",SCWS_XDICT_MEM); 如果去掉SCWS_XDICT_MEM,则分割同样的字符串时间增加, 请教这种模式的原理, apache 以loadmodule跑php,一次页面执行完毕后,应该都已经释放资源了,很困...
词库没有正确加载,你检查一下 /usr/local/scws/etc/ 下的 .xdb 的文件属性,默认.tar.bz2 解开有可能是600,建议 chmod a+r /usr/local/scws/etc/*
... scws_set_dict(s,argv[1],SCWS_XDICT_XDB); scws_set_rule(s,argv[2]); text = argv[3]; ...
... scws_set_charset(s, "utf-8"); scws_set_dict(s, "/usr/local/etc/dict.utf8.xdb", SCWS_XDICT_XDB); scws_set_rule(s, "/usr/local/etc/rules.utf8.ini"); scws_set_multi(s , 1); scws_send_text(s, text, strlen(text)); while (res = cur = scws_get_result(s)) { while (cur != NULL) { printf("Wor...
...0'] 其实你可以定时或某种其它方案把你的词库统一生成.XDB文件呀 [/quote] 这样做确实是可以,只是这时候文件就只是一个联系数据库和scws的一个中介,一个很临时的东西。我的意思是想可不可以绕过它。
...les.utf8.ini'); $cws->set_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb'); 再次运行,分词正确了[hr] 不过,又出现了奇怪的问题,我在原来的测试文本后面随便加了两个字母,分词又不对了。我继续增加字母,有时候对,有时候不对。(GB...
e:\scws\scws-1.1.5\libscws\xdb.c(555) : warning C4113: 'int (__cdecl *)()' differs in parameter lists from 'int (__cdecl *)(const void *,const void *)'