...情况,你可以修改 libscws/scws.c 第 680 行把 attr_un 改为 attr_en 即可,如果需要严格一点可以先判断一下 ch 是否为字母, 如以下: strcpy(wmap[i][i]->attr, SCWS_IS_ALPHA(txt[start-1]) ? attr_en : attr_un); 2. 百分号这个暂时 scws ...
...); $so->set_dict('words.txt',SCWS_XDICT_TXT); $so->set_ignore(true); $so->send_text("GMhello指导员"); echo ''; while ($tmp = $so->get_result()) { var_dump($tmp); } $so->close(); 在words.txt只定义如下内容 GM 1.0 1.0 * hello指导员 1.0 1.0 * 而输出结果为: array(1) { [0]=> a...
...ICT_XDB); scws_set_rule(s, "/usr/local/scws/etc/rules.ini"); scws_send_text(s, text, strlen(text)); while (res = cur = scws_get_result(s)) { while (cur != NULL) { printf("Word: %.*s/%s (IDF = %4.2f)\n", cur->len, text+cur->off, cur->attr, cur->idf); cur...
en这个可能是我们细节编 写的一个小BUG,稍后会修正,多谢汇报。因为数据太少造成和文件名冲突。
en 后来改过了,可能没有注意同步这块注释。非常感谢指出来。。。CVS代码已经清除这条注释 。 早期返回是一个静态的 word_st 结构。
en 是当初写得不规范,新版在GIT中修正了。 很快就会发布 1.1.0 正式版了,修正了少量BUG,目前还是比较稳定的了。
en,不过很杯具,我发现我昨天打的PATCH里面 *((char *)value + [color=red]len[/color]) = '\0'; 应为 *((char *)value + [color=green]rec.value.len[/color]) = '\0'; 其实这句也有点多此一举,并不是十分必要:(,反而弄错了,有个朋友说他1.1.4总是不对...