搜索

大约有 14 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0975秒)

11.我对切词尝试做了下功能修改

更新时间:2013-12-27 20:12 t By linqingtao

.../ MAX_ALNUM_CUT是中英文混合的最多多少个数母就作为一个单独的词 // 原代码默认是2 修改为了一个宏 // 这部分处理的是开头有数母的情况 // 如 “ABC中国足球" 之类的结果 // 对于上面的词...

12.使用SCWS的libscws C源码,测试分词不成功

发布时间:2014-01-02 18:01 t By banderuilq

...s; scws_res_t res, cur; char *text = "Hello, 我名叫李那曲是一个中国人, 我有时买Q币来玩, 我还听说过C#语言"; if (!(s = scws_new())) { printf("ERROR: cann't init the scws!\n"); exit(-1); } scws_set_charset(s, "utf8"); scws_set_dict(s, "/usr/loc...

13.复合分词的级别"multi" 可以设置分词的长度吗?

发布时间:2012-07-19 11:07 t By calvin

... 神啊 具体返回的json 见下面. 我想设置到 不要一个的词, 比如说至少要返回的分词是有两个符的. "multi"=>3 这个参数可以设置到吗? [code] object(stdClass)#1 (2) { ["status"]=> string(2) "ok" ["words"]=> array(7) { ...

14.关于 SCWS 简易中文分词系统

更新时间:2013-01-10 16:01 t By hightman

...等场合运用。 切词效率测试(UTF-8编码,随机从天涯抓取了一个连载页面测试结果, 45Kb左右的文本切词时间是0.026秒, 换算完毕大概是 1.5MB文本/秒) 测试过程中开启了散自动二元聚合, 长词自动补切为短词, 开启了人名地名数智...

12
  • 时间不限
  • 按相关性排序