搜索

大约有 17 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1957秒)

1.RE: http-scws(基于scws的http协议中文分词)

发布时间:2011-06-07 23:06 t By hightman

感谢分享~~ 方便一些不能装扩展的用户。 其实可以再包装一些脚本的API,使之用起来跟本地API一样简单

2.RE: http-scws(基于scws的http协议中文分词)

发布时间:2011-06-08 14:06 t By smallevil

好长时间不写C了,写着有点吃力,所以暂时先把最基本需要的分词及高频词提取写出来了。 后续等有点空时会慢慢实现更多的功能及加入相关脚本。

3.RE: [2012] SCWS-1.2.0 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2012-03-31 11:03 t By hightman

txt词库其实也是转换成XDB再调用的,不用担心性能。 你合并词典很简单啊,把 dict.utf8.xdb 导出来嘛

4.RE: [2011] SCWS-1.1.9 发布,明确使用BSD协议、支持自定义词库

发布时间:2012-02-16 10:02 t By hovea

写了一行脚本,将代码转为 UTF-8 编码的源文件: #!/bin/bash for i in `find ./ -type f |grep -v 'batch' ` ; do iconv $i -f gbk -t utf8 -o ${i}.tmp && mv ${i}.tmp $i ; done

5.RE: [2011] SCWS-1.1.9 发布,明确使用BSD协议、支持自定义词库

发布时间:2012-02-08 15:02 t By xiaomeng

我下载的是最新版php-5.3.x(vc9)http://www.ftphp.com/scws/down/php-5.3.x/php_scws.dll的,为什么加载不成功,开启错误提示了,iis6.0就重启不了了,怎么解决啊?求帮助...

6.RE: [2012] SCWS-1.2.0 发布,BSD协议、支持自定义词库、PHP5.4

发布时间:2012-05-03 20:05 t By ttff

版主您好,我在自定义词表里加了一些数字+字母的词,如pm2.5,101大楼这样。 使用的时候发现无法正常分出来,我看到新版是加了一些强制拆分的功能,但是对自定义词表里的词,也是强制拆分的码?

7.scws-1.1.9 发布,明确采用 BSD 协议;改进复合分词修正BUG等

更新时间:2011-12-28 13:12 t By hightman

2011-12-26: SCWS-1.1.9 Released. 1) 明确使用开源协议 New BSD License 发布新版本 2) 深度优化复合分词中的 SCWS_MULTISHORT 选项,更为合理有效,符合全文检索的需求 3) 测试脚本自动加载当前目录下的 dict_user.txt 文本词典 4) 修正...

8.RE: [2012] SCWS-1.2.0 发布,BSD协议、支持自定义词库、PHP5.4

发布时间:2012-04-01 14:04 t By gnhao

[quote='hightman' pid='8876' dateline='1333164684'] txt词库其实也是转换成XDB再调用的,不用担心性能。 你合并词典很简单啊,把 dict.utf8.xdb 导出来嘛 [/quote] 谢谢hm。还是更加期望加上直接入字典库的功能。这样更加方便,就是不知...

9.RE: [2012] SCWS-1.2.0 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2012-03-29 15:03 t By gnhao

$so->set_dict('D:\php\scws\etc\dict.utf8.xdb'); $so->set_rule('D:\php\scws\etc\rules.utf8.ini'); $so->add_dict('D:\php\www\htdocs\dict_extra.txt', SCWS_XDICT_TXT); hm你好。 上边的代码的确可以自定义词库,现在的scws能否直接把词加入核心词库了啊?比如直接加...

10.RE: [2012] SCWS-1.2.0 发布,BSD协议、支持自定义词库、PHP5.4

发布时间:2012-08-27 16:08 t By kill-all999

HM,您好,我目前使用自定义词库实现分词,但是通过scws_get_top5()方法获取数据的时候(字母+数字大于等于3个的时候也会返回)。求过滤方案。 $sh = scws_open(); scws_set_charset($sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_...

12
  • 时间不限
  • 按相关性排序