...cws_set_dict(s, "/usr/local/etc/dict.utf8.xdb", SCWS_XDICT_XDB); scws_set_rule(s, "/usr/local/etc/rules.utf8.ini"); scws_set_multi(s , 1); scws_send_text(s, text, strlen(text)); while (res = cur = scws_get_result(s)) { while (cur != NULL) { printf("Word: %.*s/%s (IDF = %4.2f)\n", ...
...0.0.1-pre/src# valgrind --tool=memcheck --leak-check=yes ./scwsc -r ../etc/rules.ini -d ../etc/dict.xdb -i "有用过NTFS的朋友抱怨" ==30624== Memcheck, a memory error detector. ==30624== Copyright (C) 2002-2006, and GNU GPL'd, by Julian Seward et al. ==30624== Using LibVEX rev 1658, a libra...
...则文件和词典,请从已发布的 scws-pre 版本中提取词典和 rule 文件。
...松杀归为一个人名。 其中一个解决办法是将武这个姓从rules.utf8.ini中去掉,但这不是最好的解决办法。 另一种是在看到武这个时,去判断这个字与后面的字是否组成一个词,如果是就跳过这个前缀检查。于是将scws.c的代码做了...
...new(); $so->set_charset('utf-8'); // 这里没有调用 set_dict 和 set_rule 系统会自动试调用 ini 中指定路径下的词典和规则文件 $so->send_text("我是一个中国人");; while ($tmp = $so->get_result()) { foreach($tmp as $k=>$v){ echo $v['word']."|"; } print_r($tmp); ...
..._dict(s, "/usr/local/scws/etc/dict.utf8.xdb", SCWS_XDICT_XDB); scws_set_rule(s, "/usr/local/scws/etc/rules.utf8.ini"); scws_send_text(s, text, strlen(text)); while (res = cur = scws_get_result(s)) { while (cur != NULL) { printf("WORD: %.*s/%s (IDF = %4.2f)\n", cur->len...
...,不保证这类拷贝结果会有用。 typedef struct { xdict_t d; rule_t r; unsigned char *mblen; unsigned int mode; unsigned char *txt; int len; int off; scws_res_t res0; scws_res_t res1; word_t **wmap; struct scws_zchar *zmap; } scws_st, *scws_t; struct scws_zchar { in...
...url=http://bbs.xunsearch.com/showthread.php?tid=1232][b][color=blue]SCWS - rules.ini 规则集配置文件[/color][/b][/url] [url=http://bbs.xunsearch.com/showthread.php?tid=1235][b][color=blue]SCWS - 词典词性标注详解[/color][/b][/url] [url=http://www.xunsearch.com][b][size=5]推荐: 搭...
.../b] 压缩包中包括以下部分: etc/ - gbk 版本词典和rules.ini libscws/ - scws 库核心代码 phpext/ - php4 扩展代码 (注意必须是 PHP4) src/ - scws 命令行工具 --- Notice: src/ 下的 cmd.c 必须先编译 libscws/ 生成 libscws.a 才可...