1,下载了SCWS的源码,使用其中的libscws; 2,并下载了 [简体中文(UTF-8) (3.9MB,28万词,2013/01/08更新)] scws-dict-chs-utf8.tar.bz2。 3,使用示例代码: #include #include #define SCWS_PREFIX "/usr/local/scws" main() { scws_t s; scws_res_t r...
mmbb:/usr/src/scws-0.0.1-pre/src# valgrind --tool=memcheck --leak-check=yes ./scwsc -r ../etc/rules.ini -d ../etc/dict.xdb -i "有用过NTFS的朋友抱怨" ==30624== Memcheck, a memory error detector. ==30624== Copyright (C) 2002-2006, and GNU GPL'd, by Julian Seward et al. ==30624== Using LibVE...
...字是否组成一个词,如果是就跳过这个前缀检查。于是将scws.c的代码做了如下修改, 在890行 if ((r1->flag & SCWS_ZRULE_PREFIX) && (i < (zlen - clen))) { /* prefix, check after (zmin~zmax) */ // 先检查 zmin 字内是否全部符合...
... 您好,用自定义词库是可以解决但却不是太方便,如果SCWS不能这样的配置,我还是用程序实现顺。因为用自定义词库,我得把所有的钱其它的都写进去,如 10秒 11秒 ..... 10元 11元 像这些是不固定的哈 原先我还以为rule.ini...
代码如下 $so = scws_new(); $so->set_charset('utf-8'); // 这里没有调用 set_dict 和 set_rule 系统会自动试调用 ini 中指定路径下的词典和规则文件 $so->send_text("我是一个中国人");; while ($tmp = $so->get_result()) { foreach($tmp as $k=>$v){ echo $v['word'...
[b][size=5]Libscws - 0.0.1 C API 说明[/size][/b] [b][size=4][color=#0033cc]0. 概述[/color][/size][/b] Libscws 代码是当前 SCWS(简易中文分词) 算法使用C语言编写的链接库,目前仅基于 Unix 族的操作系统,可能必须适当修改才能运行在 Windows 平台中。这...
SCWS 全称是 Simple Chinese Words Segmentation 即简易中文分词系统。 [url=http://www.xunsearch.com/scws][b][size=5][color=#FFA500]2010/01, scws-1.1.0 发布,支持加载文本词典,下载及介绍请进项目站点 http://www.xunsearch.com/scws[/color][/size][/b][/url] [url=http://w...
好消息,scws-0.0.1 pre 版提前发布,好多朋友不停的期待和催盼,这个套件先发布一个 pre 版。包括了全部代码和一份GBK词典和相关说明。为适当统计下载的人群和数量,该文件设为必须必须论坛会员才能下载,由此不便深感抱歉...