Xunsearch是我所见最好的中文开源搜索引擎了,我是drupal的使用者,如果xunsearch也能有drupal相结合的模块,那就好了。
我现在的需求是需要建个内网的搜索引擎,包括网页的抓取,搜索等,就是没有现有的数据。请问能够用Heritrix爬虫抓取网页保存到mysql,然后用xunsearch进行搜索吗?如果可以的话,这个系统要怎么设计呢?希望各位大神赐教。...
自己做个扫描程序,以文件名为key,内容为body建索引不就好了? xunsearch 本身并不是完整的搜索引擎,它是提供核心组件并附带一些例子
...为body建索引不就好了? xunsearch 本身并不是完整的搜索引擎,它是提供核心组件并附带一些例子 [/quote] 如果是页面结构相似的网页,像H大这样做更好。
用了网上的演示,这个分词系统挺好用的.但是本人是PHP新手,使用win7平台,hightman大侠提供的好像是一个中文分词引擎,不知道怎么直接在我的php空间上激活。请问我自己要怎么实现演示页面的显示效果呢?