开源免费、高性能、多功能、简单易用的全文检索技术方案 !

搜索

大约有 9 项符合查询结果，库内数据总量为 3,513 项。（搜索耗时：0.1942秒）

1.咨询SCWS准确率是如何计算出来的

发布时间：2013-10-08 17:10 t By tiankong

我想咨询一个问题。SCWS官网简介上指出，SCWS中文分词系统(Simple Chinese Word Segmentation)经小范围测试准确率在 90% ~ 95% 之间。上面的准确率是如何计算出来的呢？或者有其他类似的标准测试工具吗？谢谢！

2.RE: Windows7 分词准确率极低

发布时间：2010-12-31 10:12 t By hightman

$hdr['fsize'] 是从 XDB 的头部 unpack 出来的，可能 xdb 文件损坏了，PSCWS4的XDB文件必须和SCWS一样，从 www.ftphp.com/scws/ 下载

3.RE: Windows7 分词准确率极低

更新时间：2010-12-31 02:12 t By pittece

debug了一下，发现是在class XDB_R::_check_header()里面执行 if ($fstat['size'] != $hdr['fsize']) return false就返回了。请问这说明什么问题呢？[hr] 事实上，$hdr['fsize'] = 13245833，而$fstat['size']就是dict.xdb文件的大小4497408 ，那为什么$hdr['fsize']会等...

4.Windows7 分词准确率极低

发布时间：2010-12-31 00:12 t By pittece

我安装了PSCWS4，然后再Windows上可以顺利运行，但是分词成功率极低，比如输入： “中国航天官员应邀到美国与太空总署官员开会发展中国家上海大学城书店 ” 返回的是： “中国航天官员应官员员应邀到美国 ...

5.2007简易分词第4版(scws-0.1.x)体验

发布时间：2007-06-06 11:06 t By hightman

...自动识别，也支持UTF-8/GBK等不同字符集。经评估测试分词准确率在 95% 左右，召回率有 92% 以上。这套程序的开发其实很早就开始做基础工作了，持续时间和耗费精力都相当大。开始全部采用纯 php 代码编写，功能基本实现了...

6.RE: 公司项目求助

更新时间：2012-03-07 10:03 t By hightman

...在 scws/xunsearch 结合时作了很多特殊处理，保障查全率和准确率。比如“管理制度”　解析为　“管理制度”　OR　“管理 AND 制度”

7.SCWS是否可以提供Python扩展？

发布时间：2012-03-05 12:03 t By frostmourn716

HI 在一个项目中使用到了scws PHP的扩展，感觉scws在分词效率和准确率，以及在返回结果的可用性上，显著高于其它的扩展，想问一下，scws是否可以提供Python的扩展？

8.scws-1.0.0 正式发布 (含php扩展及2文本词典)

更新时间：2010-01-29 13:01 t By hightman

...字年代等规则识别来达到基本分词，经小范围测试大概准确率在 90% ~ 95% 之间，已能基本满足一些小型搜索引擎、关键字提取等场合运用。首次雏形版本发布于 2005 年底。本系统支持的汉字编码包括 GBK、UTF-8

9.关于 SCWS 简易中文分词系统

更新时间：2013-01-10 16:01 t By hightman

...数字年代等规则识别来达到基本分词，经小范围测试大概准确率在 90% ~ 95% 之间，已能基本满足一些小型搜索引擎、关键字提取等场合运用。切词效率测试(UTF-8编码,随机从天涯抓取了一个连载页面测试结果, 45Kb左右的文本切词...