搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

大约有 15 项符合查询结果，库内数据总量为 3,513 项。（搜索耗时：0.1978秒）

发布时间：2011-10-21 16:10 t By quankun

我现在的需求是需要建个内网的搜索引擎，包括网页的抓取，搜索等，就是没有现有的数据。请问能够用Heritrix爬虫抓取网页保存到mysql，然后用xunsearch进行搜索吗？如果可以的话，这个系统要怎么设计呢？希望各位大神赐教。...

发布时间：2013-09-23 13:09 t By a540306819

...以的。但是实现代码要你自己去写。例如你可以用CURL去抓取网页并分析网页中的链接，再去抓取，存到你的搜索项目中即可搜索。代码可参照sphider，数据存储的字段也可以参照sphider。 xunsearch只是提供了一个快速搜索的解决方...

发布时间：2011-09-30 13:09 t By hightman

是事方便加我QQ勾通或发测试代码给我 16139558 此外您的代码是直接抓取URL然后转换成DOC入库吗？

发布时间：2007-11-28 22:11 t By 逍遥小妖

...用方法不正确还是SCWS目前只能做成这样？目前我企图将抓取后的内容剔除全部不可分词要素之后在交给SCWS。但是，发现似乎总是会漏掉一些，或者有一些东西是未知的不可分词要素干扰，导致无法正确分词。请教Hightman究...

更新时间：2013-01-10 16:01 t By hightman

...字提取等场合运用。切词效率测试(UTF-8编码,随机从天涯抓取了一个连载页面测试结果, 45Kb左右的文本切词时间是0.026秒, 换算完毕大概是 1.5MB文本/秒) 测试过程中开启了散字自动二元聚合, 长词自动补切为短词, 开启了人名地名...