2007年最新的 SCWS 第4版已于近日开发完成并测试运行中。它在算法与写法上都有相当大的改进,支持自定义规则的人名等专名自动识别,也支持UTF-8/GBK等不同字符集。经评估测试分词准确率在 95% 左右,召回率有 92% 以上。 这...
抱歉,很久没有顾及 xunsearch。 刚刚升级到 xapian-1.2.19,scws-1.2.3-dev 最新版本,如果使用中发现有异常的,可以尝试升级到这个最新版本。 下载地址:[url]http://www.xunsearch.com/download/xunsearch-full-dev.tar.bz2[/url]
[url=http://www.yanbin.org/download/scws-0.0.1-pre_win32_php-4.4.x.zip][color=#810081]点击下载 SCWS 扩展 PHP 4.4.x 版二进制文件[/color][/url] [url=http://www.yanbin.org/download/scws-0.0.1-pre_win32_php-5.2.x.zip][color=#810081]点击下载 SCWS 扩展 PHP 5.2.x 版二进制文件[/colo...
[b]2.0封装了scws的全部功能,并以json格式返回数据[/b] 软件基于scws 1.1.7版本二次开发 基于libevent进行http封装,请求更简单 功能: 1.词库为文本文件方式,增加、删除更方便 2.支持gbk与utf-8(基于scws功能) 3.运行中可修改词...
我电脑APACHE+PHP 4GB内存 E6300处理器 PHP简易中文分词(SCWS) 第4版(GBK) 在我电脑上用你默认的分词内容"陈凯歌并不是..." 第一次0.8xxxs 第二次0.098711013793945 而你们演示的就快多了 0.0039410591125488 为什么差距这么大?
...加用户案例文档:USERCASE 3. 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 4. 升级 libevent 到 2.x 版 5. 修正中文 stopwords 不生效的问题 6. 取消恼人的 NODB(S#506) 错误提示 7. 新增获取文档匹配词表的接口 XSSearch::setRequireMatc...
...。这是一个细节改进版,还整合升级了最新的 xapian-1.2.15/scws-1.2.2,[color=#FF0000][b]强烈建议所有用户升级到这个最新稳定版!![/b][/color] 小提示,由于升级了 xapian-core,因此升级过程可能会稍显漫长,请不必担忧,耐心等候即...
好消息,scws-0.0.1 pre 版提前发布,好多朋友不停的期待和催盼,这个套件先发布一个 pre 版。包括了全部代码和一份GBK词典和相关说明。为适当统计下载的人群和数量,该文件设为必须必须论坛会员才能下载,由此不便深感抱歉...
2010-12-31: SCWS-1.1.5 Released. 1) 修正 xdb.c 中存在的一处缓冲区溢出, 感谢论坛网友 hovea. 2) 修正 phpext/ 中 scws_get_result() 参数解析里多了一个z 的问题,感谢网友(阿男)告知 3) 修正 scws.c 中某些字符在ignore symbol设置下无效的问...
SCWS 全称是 Simple Chinese Words Segmentation 即简易中文分词系统。 [url=http://www.xunsearch.com/scws][b][size=5][color=#FFA500]2010/01, scws-1.1.0 发布,支持加载文本词典,下载及介绍请进项目站点 http://www.xunsearch.com/scws[/color][/size][/b][/url] [url=http://w...