搜索

大约有 58 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.4879秒)

51.使用SCWS的libscws C源码,测试分词不成功

发布时间:2014-01-02 18:01 t By banderuilq

1,下载了SCWS的源码,使用其中的libscws; 2,并下载了 [简体中文(UTF-8) (3.9MB,28万词,2013/01/08更新)] scws-dict-chs-utf8.tar.bz2。 3,使用示例代码: #include #include #define SCWS_PREFIX "/usr/local/scws" main() { scws_t s; scws_res_t r...

52.scws-0.0.1-pre有内存泄露(问题确认,已解决)

发布时间:2007-11-27 00:11 t By mfd

mmbb:/usr/src/scws-0.0.1-pre/src# valgrind --tool=memcheck --leak-check=yes ./scwsc -r ../etc/rules.ini -d ../etc/dict.xdb -i "有用过NTFS的朋友抱怨" ==30624== Memcheck, a memory error detector. ==30624== Copyright (C) 2002-2006, and GNU GPL'd, by Julian Seward et al. ==30624== Using LibVE...

53.RE: 遇到一个分词错误的问题

发布时间:2014-02-11 11:02 t By robinjia

...字是否组成一个词,如果是就跳过这个前缀检查。于是将scws.c的代码做了如下修改, 在890行 if ((r1->flag & SCWS_ZRULE_PREFIX) && (i < (zlen - clen))) { /* prefix, check after (zmin~zmax) */ // 先检查 zmin 字内是否全部符合...

54.RE: 10秒 10元 这样的想做为一个词要怎么配置

发布时间:2011-10-31 10:10 t By xjtdy888

... 您好,用自定义词库是可以解决但却不是太方便,如果SCWS不能这样的配置,我还是用程序实现顺。因为用自定义词库,我得把所有的钱其它的都写进去,如 10秒 11秒 ..... 10元 11元 像这些是不固定的哈 原先我还以为rule.ini...

55.请教为什么我这个无法分割成功啊?

发布时间:2011-07-05 20:07 t By cool

代码如下 $so = scws_new(); $so->set_charset('utf-8'); // 这里没有调用 set_dict 和 set_rule 系统会自动试调用 ini 中指定路径下的词典和规则文件 $so->send_text("我是一个中国人");; while ($tmp = $so->get_result()) { foreach($tmp as $k=>$v){ echo $v['word'...

56.Libscws C API 使用说明

更新时间:2010-12-30 22:12 t By hightman

[b][size=5]Libscws - 0.0.1 C API 说明[/size][/b] [b][size=4][color=#0033cc]0. 概述[/color][/size][/b] Libscws 代码是当前 SCWS(简易中文分词) 算法使用C语言编写的链接库,目前仅基于 Unix 族的操作系统,可能必须适当修改才能运行在 Windows 平台中。这...

57.关于 SCWS 简易中文分词系统

更新时间:2013-01-10 16:01 t By hightman

SCWS 全称是 Simple Chinese Words Segmentation 即简易中文分词系统。 [url=http://www.xunsearch.com/scws][b][size=5][color=#FFA500]2010/01, scws-1.1.0 发布,支持加载文本词典,下载及介绍请进项目站点 http://www.xunsearch.com/scws[/color][/size][/b][/url] [url=http://w...

58.好消息,scws-0.0.1 pre 版发布!!

发布时间:2007-06-09 11:06 t By hightman

好消息,scws-0.0.1 pre 版提前发布,好多朋友不停的期待和催盼,这个套件先发布一个 pre 版。包括了全部代码和一份GBK词典和相关说明。为适当统计下载的人群和数量,该文件设为必须必须论坛会员才能下载,由此不便深感抱歉...

  • 时间不限
  • 按相关性排序