主要修改日志: * 09-30 13:11 bdcdacc hightman: PHP-SDK: 修正搜索语句用符号开头时日志前多个空格的问题 * 09-30 12:34 fc47554 hightman: PHP-SDK: 增加相关搜索中 cleanFieldQuery 的判断 * 09-30 11:43 d3408f0 hightman: 在文档致谢中增加 Yii * 09-30 11:31 44f7a...
...发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您降低服务器搜索负荷、极大程度的提高搜索速度和用户体验。 [b]高性能:[/b]后端是采用 C/C++ 开发多线程服务端,索引设计基于 Xapian ...
...发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您降低服务器搜索负荷、极大程度的提高搜索速度和用户体验。 [b]高性能:[/b]后端是采用 C/C++ 开发多线程服务端,索引设计基于 Xapian ...
...发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您降低服务器搜索负荷、极大程度的提高搜索速度和用户体验。 [b]高性能:[/b]后端是采用 C/C++ 开发多线程服务端,索引设计基于 Xapian ...
...发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您降低服务器搜索负荷、极大程度的提高搜索速度和用户体验。 [b]高性能:[/b]后端是采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 ...
...进一些显示效果 3. 搜索日志记录时排除具有明显特征的搜索引擎爬虫 官方网站:[url]http://www.xunsearch.com[/url] 下载地址:[url]http://www.xunsearch.com/download/xunsearch-full-latest.tar.bz2[/url] 代码仓库:[url]https://github.com/hightman/xunsearch[/ur...
...中文分词和全文搜索。 就是因为提取出更多的页面,让搜索引擎蜘蛛没完没了的爬,达到网页聚合的目的。这样做我估计对优化很有帮助。 选择scws的原因是比较了几个中文分词后,感觉scws是一个不错的分词系统。 xunsearch速度...
...测试大概准确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、关键字提取等场合运用。 切词效率测试(UTF-8编码,随机从天涯抓取了一个连载页面测试结果, 45Kb左右的文本切词时间是0.026秒, 换算完毕大概是 1.5MB文本/秒) 测试...