目前用xunsearch做了一个项目,结果非常满意。 但是我用了后想提一点我个人的建议。 在数据导入xunsearch有时候需要对数据进行过滤。根据官方的文档进行操作是OK。 但是感觉有点小麻烦。 每次导入的时候都需要指定过滤器...
...unsearch 旨在帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。 /* 第二条注释 /* Xunsearch 中文译名为“迅搜”,代码中的经常被缩写为 XS,既是英文名称的缩略也是中文声母缩写。 这儿的“迅”是...
...您的TF/IDF算法共享出来么?批量添加词库的时候真的很不方便啊,如果写个脚本调用你的[url=http://www.ftphp.com/scws/demo/get_tfidf.php]在线TF/IDF算法工具[/url],恐怕上万条请求你的服务器招架不住啊。。。 老大你的词库更新的好慢啊...
发现xunsearch很有前途的。 如果能够再将爬虫部分也一起组合起来,并提供前端PHP页面。。。提供一体化的解决方案就更方便了。。。。
xdb 就是一个自己设计的用来保存常量数据库(基本上只读少改)文件格式,类似 gdbm, cdb 这些格式 xtree 是一个HASH + tree 的内存数据结构,可以方便的和 xdb 进行互换