搜索

大约有 15 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1978秒)

11.关于xunsearch的使用范围。。。

发布时间:2011-10-21 16:10 t By quankun

我现在的需求是需要建个内网的搜索引擎,包括网页的抓取,搜索等,就是没有现有的数据。请问能够用Heritrix爬虫抓取网页保存到mysql,然后用xunsearch进行搜索吗?如果可以的话,这个系统要怎么设计呢?希望各位大神赐教。...

12.RE: 可以实现搜索纯静态网站吗?

发布时间:2013-09-23 13:09 t By a540306819

...以的。但是实现代码要你自己去写。例如你可以用CURL去抓取网页并分析网页中的链接,再去抓取,存到你的搜索项目中即可搜索。代码可参照sphider,数据存储的字段也可以参照sphider。 xunsearch只是提供了一个快速搜索的解决方...

13.RE: 在更新索引时,经常出错,麻烦大家看看

发布时间:2011-09-30 13:09 t By hightman

是事方便加我QQ勾通或发测试代码给我 16139558 此外您的代码是直接抓取URL然后转换成DOC入库吗?

14.一个疑问……

发布时间:2007-11-28 22:11 t By 逍遥小妖

...用方法不正确还是SCWS目前只能做成这样? 目前我企图将抓取后的内容剔除全部不可分词要素之后在交给SCWS。但是,发现似乎总是会漏掉一些,或者有一些东西是未知的不可分词要素干扰,导致无法正确分词。 请教Hightman究...

15.关于 SCWS 简易中文分词系统

更新时间:2013-01-10 16:01 t By hightman

...字提取等场合运用。 切词效率测试(UTF-8编码,随机从天涯抓取了一个连载页面测试结果, 45Kb左右的文本切词时间是0.026秒, 换算完毕大概是 1.5MB文本/秒) 测试过程中开启了散字自动二元聚合, 长词自动补切为短词, 开启了人名地名...

12
  • 时间不限
  • 按相关性排序