搜索

大约有 18 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2940秒)

11.关于 SCWS 简易中文分词系统

更新时间:2013-01-10 16:01 t By hightman

SCWS 全称是 Simple Chinese Words Segmentation 即简易中文分词系统。 [url=http://www.xunsearch.com/scws][b][size=5][color=#FFA500]2010/01, scws-1.1.0 发布,支持加载文本词典,下载及介绍请进项目站点 http://www.xunsearch.com/scws[/color][/size][/b][/url] [url=http://w...

12.xunsearch-1.2.0 (基于xapian/scws/php的开源中文全文搜索,自定义词库、搜索日志管理)

发布时间:2011-12-12 17:12 t By hightman

经过开发给不断的努力和测试,以及吸收了大量网友的反馈意见,很高兴于今天发布 Xunsearch 1.2.0 正式版。 这次修订主要是开发了一些新功能,同时修正了一些 BUG,强烈各位用户建议升级到该最新稳定版本。新增的主要功能...

13.咨询SCWS准确率是如何计算出来的

发布时间:2013-10-08 17:10 t By tiankong

我想咨询一个问题。SCWS官网简介上指出,SCWS中文分词系统(Simple Chinese Word Segmentation)经小范围测试准确率在 90% ~ 95% 之间。 上面的准确率是如何计算出来的呢?或者有其他类似的标准测试工具吗?谢谢!

14.[求助]如何转换pre版本的xdb为txt格式

发布时间:2007-12-25 17:12 t By hackson

...人。共同学习才能共同提高,取长补短,分词是很重要的中文信息分析基础技术,中国的信息化建设要达到国际水平,分词技术一定不可以少的,一定要有很多的具有奉献精神的有志之士共同努力,hightman就是我学习的榜样:)

15.xunsearch-1.4.1 (xapian+scws 开源搜索引擎,修正搜索进程死锁)

发布时间:2013-02-21 11:02 t By hightman

...采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅...

16.同义词搜索

... > tip: 独立词汇的意思对于英文来说就是一个单词,对于中文来说必须是 `scws` 词库中的一个词。 > _Xunsearch_ 的同义词不同于 _Xapian_,会智能进行字段匹配和转换,您只需维护通用词库。 英文同义词的特殊处理 ------------------ ...

17.最新的主要变动

...rScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch::setRequireMatchedTerm] 版本 1.4.7 (2013-7-30) ---------------------- - 优化安装脚本...

18.编写第一个配置文件

...,分词器当然选用 `full`。 - `author` 作者名字检索,考虑中文名支持,所以建议这个字段保留使用默认内置的 `scws` 分词器。 由于希望在默认不指明字段的情况下也能检索作者字段,所以它的过索引方式应为 `both`。 - `authorid` 作...

12
  • 时间不限
  • 按相关性排序