主要修改日志: * 09-30 13:11 bdcdacc hightman: PHP-SDK: 修正搜索语句用符号开头时日志前多个空格的问题 * 09-30 12:34 fc47554 hightman: PHP-SDK: 增加相关搜索中 cleanFieldQuery 的判断 * 09-30 11:43 d3408f0 hightman: 在文档致谢中增加 Yii * 09-30 11:31 44f7a...
...包,便可十分容易的进行 二次开发,打造出自己的全文搜索引擎。 * __功能强大__ 支持字段检索、结果高亮、字段排序、布尔语法、区间检索、聚合搜索、相关搜索、 权重微调、*拼音搜索*、*搜索建议*等专业搜索引擎具备...
...进一些显示效果 3. 搜索日志记录时排除具有明显特征的搜索引擎爬虫 官方网站:[url]http://www.xunsearch.com[/url] 下载地址:[url]http://www.xunsearch.com/download/xunsearch-full-latest.tar.bz2[/url] 代码仓库:[url]https://github.com/hightman/xunsearch[/ur...
...发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您降低服务器搜索负荷、极大程度的提高搜索速度和用户体验。 [b]高性能:[/b]后端是采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 ...
...测试大概准确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、关键字提取等场合运用。 切词效率测试(UTF-8编码,随机从天涯抓取了一个连载页面测试结果, 45Kb左右的文本切词时间是0.026秒, 换算完毕大概是 1.5MB文本/秒) 测试...
...中文分词和全文搜索。 就是因为提取出更多的页面,让搜索引擎蜘蛛没完没了的爬,达到网页聚合的目的。这样做我估计对优化很有帮助。 选择scws的原因是比较了几个中文分词后,感觉scws是一个不错的分词系统。 xunsearch速度...
Xunsearch是我所见最好的中文开源搜索引擎了,我是drupal的使用者,如果xunsearch也能有drupal相结合的模块,那就好了。
Xunsearch是我所见最好的中文开源搜索引擎了,我是drupal的使用者,如果xunsearch也能有drupal相结合的模块,那就好了。
...改进一些显示效果 - 搜索日志记录时排除具有明显特征的搜索引擎爬虫 版本 1.4.0 (2013-1-22) ---------------------- - 升级整合最新的 xapian-1.2.13、scws-1.2.1 - 新增支持项目自定义词库,[参见文档](index.dict) - 改进网络 IO 读取,优化搜索...
...试大 概准确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、关键字提取 等场合运用。首次雏形版本发布于 2005 年底。 本系统支持的汉字编码包括 GBK、UTF-8