原先有计划要移到google code上,可是发现 scws 这名字被人给注册了。。。:(
下载包中的 scws-1.1.2.tar.bz2 或下载中的 rules.tgz 均为最新
[quote='hightman' pid='3543' dateline='1273739877'] 下载包中的 scws-1.1.2.tar.bz2 或下载中的 rules.tgz 均为最新 [/quote] 已经更新了:D
...有这么一句话: [i][b]注:xdict_t 和 rule_t 分别是词典和规则集的指针,可判断其是否为 NULL 来判断加载的成功与失败。[/b][/i] 调用函数 scws_add_dict() ,scws_set_rule()来加载词库和规则集, 这两个函数在其内部都没有对是否加载成...
每个线程需要单独的SCWS实例 ,词典和规则集倒是可以共用的,主线程正常操作,其它线程可以在 scws 创建后通过 thread_scws->d = main_scws->d; thread_scws_r = main_scws->r; 来共用它们,因为词典和规则集都是只读而且各API都是线程安全...
...ar { int start; int end; }; 注:xdict_t 和 rule_t 分别是词典和规则集的指针,可判断其是否为 NULL 来判断加载的成功与失败。 ·[b]scws 系列结果集[/b],每次 scws 返回的分词结果的数量都是不定的,直到返回结果为 NULL 才表示这次分...
杯具的分词词库和规则集导致这个结果, 稍后我看能不能简单调整一下规则集来获得比较好的效果。 查到原因了,是因为词库里居然有个错误的词叫“民医院”!! 建议删除该词重新生成词典或,写一个附加词典标记为删除。...
; ; auto regular ; $Id: rules.ini,v 1.3 2007/06/07 08:37:07 hightman Exp $ ; ; special word, 特殊词汇 ; [special] C++ .NET C# R&B S.H.E P&B ; ; nostats ; [nostats] about all also an and any are as at be but by both can for from have here if in is it no ...
...nd_text 方法或 scws_send_text 函数被调用前,没有加载词典和规则集时,系统会自动在scws.default.fpath(ini配置)中查找相应的字符集词典。词典和规则文件的命名方式为 dict[.字符集].xdb 和 rules[.字符集].ini ,当字符集是 gbk 时中括号里...