搜索

大约有 9 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1942秒)

1.咨询SCWS确率是如何计算出来的

发布时间:2013-10-08 17:10 t By tiankong

我想咨询一个问题。SCWS官网简介上指出,SCWS中文分词系统(Simple Chinese Word Segmentation)经小范围测试确率在 90% ~ 95% 之间。 上面的确率是如何计算出来的呢?或者有其他类似的标准测试工具吗?谢谢!

2.RE: Windows7 分词确率极低

发布时间:2010-12-31 10:12 t By hightman

$hdr['fsize'] 是从 XDB 的头部 unpack 出来的,可能 xdb 文件损坏了,PSCWS4的XDB文件必须和SCWS一样,从 www.ftphp.com/scws/ 下载

3.RE: Windows7 分词确率极低

更新时间:2010-12-31 02:12 t By pittece

debug了一下,发现是在class XDB_R::_check_header()里面执行 if ($fstat['size'] != $hdr['fsize']) return false就返回了。请问这说明什么问题呢?[hr] 事实上,$hdr['fsize'] = 13245833, 而$fstat['size']就是dict.xdb文件的大小4497408 ,那为什么$hdr['fsize']会等...

4.Windows7 分词确率极低

发布时间:2010-12-31 00:12 t By pittece

我安装了PSCWS4,然后再Windows上可以顺利运行,但是分词成功率极低,比如输入: “中国航天官员应邀到美国与太空总署官员开会 发展中国家 上海大学城书店 ” 返回的是: “中 国 航 天 官员应 官员 员应 邀 到 美 国 ...

5.2007简易分词第4版(scws-0.1.x)体验

发布时间:2007-06-06 11:06 t By hightman

...自动识别,也支持UTF-8/GBK等不同字符集。经评估测试分词确率在 95% 左右,召回率有 92% 以上。 这套程序的开发其实很早就开始做基础工作了,持续时间和耗费精力都相当大。开始全部采用纯 php 代码编写,功能基本实现了...

6.RE: 公司项目求助

更新时间:2012-03-07 10:03 t By hightman

...在 scws/xunsearch 结合时作了很多特殊处理,保障查全率和确率。 比如“管理制度” 解析为 “管理制度” OR “管理 AND 制度”

7.SCWS是否可以提供Python扩展?

发布时间:2012-03-05 12:03 t By frostmourn716

HI 在一个项目中使用到了scws PHP的扩展,感觉scws在分词效率和确率,以及在返回结果的可用性上,显著高于其它的扩展,想问一下,scws是否可以提供Python的扩展?

8.scws-1.0.0 正式发布 (含php扩展及2文本词典)

更新时间:2010-01-29 13:01 t By hightman

...字年代等规则识别来达到基本分词,经小范围测试大 概确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、关键字提取 等场合运用。首次雏形版本发布于 2005 年底。 本系统支持的汉字编码包括 GBK、UTF-8

9.关于 SCWS 简易中文分词系统

更新时间:2013-01-10 16:01 t By hightman

...数字年代等规则识别来达到基本分词,经小范围测试大概确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、关键字提取等场合运用。 切词效率测试(UTF-8编码,随机从天涯抓取了一个连载页面测试结果, 45Kb左右的文本切词...

  • 时间不限
  • 按相关性排序