搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

1.xunsearch-1.4.8 (基于 xapian+scws 的开源中文搜索引擎，小问题优化改进)

发布时间：2013-12-11 15:12 t By hightman

...s 接受参数作为复合等级 4. 升级 libevent 到 2.x 版 5. 修正中文 stopwords 不生效的问题 6. 取消恼人的 NODB(S#506) 错误提示 7. 新增获取文档匹配词表的接口 XSSearch::setRequireMatchedTerm 官方网站：[url]http://www.xunsearch.com[/url] 下载地址...

2.xunsearch-1.0.0 正式版 (基于xapian/scws/php的开源中文全文搜索引擎)

发布时间：2011-09-23 13:09 t By hightman

...采用 C/C++ 开发多线程服务端，索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据，在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用：[/b]前端是使用脚本语言编写的开发工具 (SDK)，目前...

3.RE: 中文分组粗分方法

发布时间：2010-05-26 19:05 t By baobao

我用您发布的工具，把字典解压。得出了关于的词的字段 WORD TF IDF ATTR 当机立断 14.01 8.10 i WORD ATTR我都能理解。上贴说的逐字分词后计算权重的时候使用IDF，貌似就是类似基于字典的最大概率方式来定义权重...

4.xunsearch-1.4.0 (基于xapian+scws的开源中文搜索，大幅改进性能及稳定性)

发布时间：2013-01-22 12:01 t By hightman

...采用 C/C++ 开发多线程服务端，索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据，在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用：[/b]前端是使用脚本语言编写的开发工具 (SDK)，目前仅...

5.xunsearch-1.0.0 正式版

更新时间：2011-09-30 14:09 t By hightman

...采用 C/C++ 开发多线程服务端，索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据，在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用：[/b]前端是使用脚本语言编写的开发工具 (SDK)，目前...

6.scws-1.0.0 正式发布 (含php扩展及2文本词典)

更新时间：2010-01-29 13:01 t By hightman

...明节选] SCWS 是 Simple Chinese Words Segmentation 的缩写（简易中文分词系统）。它是一套基于词频词典的机械中文分词引擎，它能将一整段的汉字基本正确的切分成词，因为词是汉语的基本语素单位，而书写的时候不像英语会在词...

7.C版简易中文分词-cscwsd-0.0.3 发布

发布时间：2007-06-06 10:06 t By hightman

[b][size=3]简要说明[/size][/b] cscwsd 是英文全称 C-Simpled Chinese Word Segment Daemon 的首字缩写，这是用标准纯 C 编写，并配合使用 autoconf GNU软件工具包, 基本上可以很方便在的各类 Unix-Like OS 系统下顺利编译执行。目前测试过的有 RedHat...

8.xunsearch-1.4.6 (基于 xapian 和 scws开源中文搜索引擎，高扛压不再死锁)

更新时间：2013-03-27 13:03 t By hightman

...采用 C/C++ 开发多线程服务端，索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据，在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用：[/b]前端是使用脚本语言编写的开发工具 (SDK)，目前仅...

9.xunsearch-1.4.7 (基于 xapian+scws 的开源中文搜索引擎，诸多细节改进)

发布时间：2013-07-30 11:07 t By hightman

...采用 C/C++ 开发多线程服务端，索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据，在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用：[/b]前端是使用脚本语言编写的开发工具 (SDK)，目前仅...

SCWS 全称是 Simple Chinese Words Segmentation 即简易中文分词系统。 [url=http://www.xunsearch.com/scws][b][size=5][color=#FFA500]2010/01, scws-1.1.0 发布，支持加载文本词典，下载及介绍请进项目站点 http://www.xunsearch.com/scws[/color][/size][/b][/url] [url=http://w...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

搜索

1.xunsearch-1.4.8 (基于 xapian+scws 的开源中文搜索引擎，小问题优化改进)

2.xunsearch-1.0.0 正式版 (基于xapian/scws/php的开源中文全文搜索引擎)

3.RE: 中文分组粗分方法

4.xunsearch-1.4.0 (基于xapian+scws的开源中文搜索，大幅改进性能及稳定性)

5.xunsearch-1.0.0 正式版

6.scws-1.0.0 正式发布 (含php扩展及2文本词典)

7.C版简易中文分词-cscwsd-0.0.3 发布

8.xunsearch-1.4.6 (基于 xapian 和 scws开源中文搜索引擎，高扛压不再死锁)

9.xunsearch-1.4.7 (基于 xapian+scws 的开源中文搜索引擎，诸多细节改进)

10.关于 SCWS 简易中文分词系统

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索