搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

1.xunsearch-1.4.8 (基于 xapian+scws 的开源中文搜索引擎，小问题优化改进)

发布时间：2013-12-11 15:12 t By hightman

...s 接受参数作为复合等级 4. 升级 libevent 到 2.x 版 5. 修正中文 stopwords 不生效的问题 6. 取消恼人的 NODB(S#506) 错误提示 7. 新增获取文档匹配词表的接口 XSSearch::setRequireMatchedTerm 官方网站：[url]http://www.xunsearch.com[/url] 下载地址...

2.xunsearch-1.0.0 正式版 (基于xapian/scws/php的开源中文全文搜索引擎)

发布时间：2011-09-23 13:09 t By hightman

...采用 C/C++ 开发多线程服务端，索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据，在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用：[/b]前端是使用脚本语言编写的开发工具 (SDK)，目前...

3.RE: 中文分组粗分方法

发布时间：2010-05-26 19:05 t By baobao

我用您发布的工具，把字典解压。得出了关于的词的字段 WORD TF IDF ATTR 当机立断 14.01 8.10 i WORD ATTR我都能理解。上贴说的逐字分词后计算权重的时候使用IDF，貌似就是类似基于字典的最大概率方式来定义权重...

4.xunsearch-1.4.0 (基于xapian+scws的开源中文搜索，大幅改进性能及稳定性)

发布时间：2013-01-22 12:01 t By hightman

...采用 C/C++ 开发多线程服务端，索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据，在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用：[/b]前端是使用脚本语言编写的开发工具 (SDK)，目前仅...

5.xunsearch-1.0.0 正式版

更新时间：2011-09-30 14:09 t By hightman

...采用 C/C++ 开发多线程服务端，索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据，在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用：[/b]前端是使用脚本语言编写的开发工具 (SDK)，目前...

6.scws-1.0.0 正式发布 (含php扩展及2文本词典)

更新时间：2010-01-29 13:01 t By hightman

...明节选] SCWS 是 Simple Chinese Words Segmentation 的缩写（简易中文分词系统）。它是一套基于词频词典的机械中文分词引擎，它能将一整段的汉字基本正确的切分成词，因为词是汉语的基本语素单位，而书写的时候不像英语会在词...

7.C版简易中文分词-cscwsd-0.0.3 发布

发布时间：2007-06-06 10:06 t By hightman

[b][size=3]简要说明[/size][/b] cscwsd 是英文全称 C-Simpled Chinese Word Segment Daemon 的首字缩写，这是用标准纯 C 编写，并配合使用 autoconf GNU软件工具包, 基本上可以很方便在的各类 Unix-Like OS 系统下顺利编译执行。目前测试过的有 RedHat...

8.xunsearch-1.4.6 (基于 xapian 和 scws开源中文搜索引擎，高扛压不再死锁)

更新时间：2013-03-27 13:03 t By hightman

...采用 C/C++ 开发多线程服务端，索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据，在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用：[/b]前端是使用脚本语言编写的开发工具 (SDK)，目前仅...

9.关于 Xunsearch PHP-SDK

关于 Xunsearch PHP-SDK Xunsearch （中文名：迅搜）是一套免费开源的专业中文全文检索解决方案，简单易用而且功能强大、性能卓越能轻松处理海量数据的全文检索。它包含后端索引、搜索服务程序和前端脚本语...

10.xunsearch-1.4.7 (基于 xapian+scws 的开源中文搜索引擎，诸多细节改进)

发布时间：2013-07-30 11:07 t By hightman

...采用 C/C++ 开发多线程服务端，索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据，在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用：[/b]前端是使用脚本语言编写的开发工具 (SDK)，目前仅...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索