开源免费、高性能、多功能、简单易用的全文检索技术方案 !

搜索

大约有 62 项符合查询结果，库内数据总量为 3,513 项。（搜索耗时：0.1979秒）

1.纯HTML页面如何收录

更新时间：2012-03-12 00:03 t By iqpkeq

我看了那个文档，发现有一种是文件数据源，还有一种是SQL库的数据源但是纯HTML页面，如何收录或者生成索引？比如www下面某个文件夹全是html格式的静态页面，这样的情况怎么弄啊？

2.RE: 纯HTML页面如何收录

发布时间：2012-03-14 20:03 t By iqpkeq

...an' pid='639' dateline='1331712167'] 那你说的应该是XML数据源，HTML不好当数据源吧 [/quote] 呃，H大，我想到的是，Xunsearch既然是出色的全文搜索引擎，那么应该具有的功能是：类似百度或者谷歌的，那么应该优先可以收录HTML页面...

3.RE: 纯HTML页面如何收录

发布时间：2012-03-14 16:03 t By hightman

那你说的应该是XML数据源，HTML不好当数据源吧

4.RE: 纯HTML页面如何收录

发布时间：2012-04-04 18:04 t By iqpkeq

[quote='caixun2002' pid='697' dateline='1333531606'] 额，楼上想做个千度么，那得好好研究呢。 [/quote] 呃，不是千度，而是有大量html的页面，但是没有办法用xunsearch，感觉很遗憾的！

5.RE: 纯HTML页面如何收录

发布时间：2012-04-05 00:04 t By caixun2002

...那得好好研究呢。 [/quote] 呃，不是千度，而是有大量html的页面，但是没有办法用xunsearch，感觉很遗憾的！ [/quote] 开个玩笑，不过这个确实不是xunsearch的工作，并且这个做起来很复杂。

6.RE: 纯HTML页面如何收录

发布时间：2012-03-12 14:03 t By iqpkeq

...是按主键或者键名键值来定义搜索，我在想，能不能定义html的标签，来检索内容否则的话，百度或者google是怎么去检索那些静态的网页或文档的，可能那些网页都不是有数据库的！那如何收录？

7.转义过的HTML搜索问题

发布时间：2014-07-08 14:07 t By stalvan

...在线编辑器。那么我该如何修改才能时这种带有转义过的HTML标签文的内容可以被正确检索呢？:huh:

8.RE: 纯HTML页面如何收录

发布时间：2012-03-12 13:03 t By sunxiquan

这个嘛只能搜索数据库吧

9.RE: 纯HTML页面如何收录

发布时间：2012-04-04 17:04 t By caixun2002

额，楼上想做个千度么，那得好好研究呢。

10.RE: 纯HTML页面如何收录

发布时间：2012-04-05 10:04 t By hightman

自己做个扫描程序，以文件名为key，内容为body建索引不就好了？ xunsearch 本身并不是完整的搜索引擎，它是提供核心组件并附带一些例子