搜索

大约有 80 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1962秒)

51.载入txt词典所出现的BUG

更新时间:2011-08-09 12:08 t By 999

...利斯!'; $so = scws_open(); scws_set_charset($so, 'gbk'); scws_set_rule($so, 'rules.ini'); scws_set_dict($so, 'a.txt', SCWS_XDICT_TXT); scws_send_text($so, $txt); $result = scws_get_tops($so, strlen($txt)); print_r($result); [/php] 第一次运行的结果:([color=#FF0000][b]正...

52.RE: [2012] SCWS-1.2.0 发布,BSD协议、支持自定义词库、PHP5.4

发布时间:2012-08-27 16:08 t By kill-all999

...$sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_set_rule($sh, './rules.ini');//文件内容为空 $cutword = $_POST['cutword']; scws_send_text($sh, $cutword); $rs = scws_get_tops($sh, 5); 另:我使用工具把默认的.xdb转化成.txt后在使用scws_get_tops()方法(...

53.SCWS-1.1.9 没法分中文?

发布时间:2012-01-07 12:01 t By hejone

...s_set_dict(s, "/usr/local/scws/etc/dict.xdb", SCWS_XDICT_XDB); scws_set_rule(s, "/usr/local/scws/etc/rules.ini"); scws_send_text(s, text, strlen(text)); while (res = cur = scws_get_result(s)) { while (cur != NULL) { printf("Word: %.*s/%s (IDF = %4.2f)\n", cur-...

54.RE: SCWS - 比如我要加入关键词 65Mn这种专业词怎么做

发布时间:2012-08-20 16:08 t By hightman

etc/rules.utf8.ini 中添加

55.10秒 10元 这样的想做为一个词要怎么配置

发布时间:2011-10-28 17:10 t By xjtdy888

10秒 10元 这样的想做为一个词要怎么配置 ?? 我尝试了修改rule.ini但是不成功。如果数字是全角的话倒是可以成为词,但我同时也需要半角的数字+单位 作为一个词,

56.RE:1234

发布时间:2007-06-20 20:06 t By potato

[quote]压缩包中包括以下部分: etc/ - gbk 版本词典和rules.ini libscws/ - scws 库核心代码 phpext/ - php4 扩展代码 (注意必须是 PHP4) src/ - scws 命令行工具 --- Notice: src/ 下的 cmd.c 必须先编译 libscws/ 生成 libscws.a 才可...

57.发一个稳定复现的问题

更新时间:2014-03-03 15:03 t By getwe

... printf("Usage : %s dict rule\n",argv[0]); return -1; } scws_t ...

58.我想过滤由‘人’‘得’‘到’‘直’ 这几个字组成的关键字

更新时间:2010-05-29 11:05 t By 燧人氏

官方没有rules.ini文件的使用说明。 我想过滤由‘人’‘得’‘到’‘直’ 等字组成的关键字。如 人们、赚得、人民、得到、到达、直到 这些无意义的关键字。 需要怎么弄? 我看了你们的置顶贴了,有添加自字义字库,...

59.set ignore bug ?全角数字不见了

发布时间:2011-11-03 13:11 t By xjtdy888

...全角字符不显示 下面是我的测试。 [xxxxxx@www etc]$ scws -r rules.utf8.ini -d dict.utf8.xdb -c utf-8 -I 今天花了12万元啊 今 天花 了 万 元 啊 [xxxxx@www etc]$ scws -v scws (scws-cli/1.1.8: Simpled Chinese Words Segment - Command line usage) 版本1.1.8

60.libscws 段错误的 bug 修正

发布时间:2007-07-05 09:07 t By hightman

...个 unsigned char 来记录分词的长度,存在特殊情况即通过 rules.ini 自动识别出来的词有可能超过 255 字,如全部连续的双字节数字或字母.超过 255 字后 这里的 j 将变得不正确可能导致 item-> 指向 NULL , 故加入以下红色部分判断. ...

  • 时间不限
  • 按相关性排序