搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

201.xdb文件读取小BUG

发布时间：2011-11-15 15:11 t By scgywx

...offset超过文件大小就会失败)，程序还会继续往下执行，这样下面的代码执行将会报错。

202.RE: 建议能否增加一个检索过滤接口 SetFilter

发布时间：2012-02-27 10:02 t By hightman

其实在 xunsearch 的世界里，你的情况完全可以这样作。。。。假设分类字段 catalog ID为 A 下的子分类为 AA,AB,AC ... 那么你给子分类的数据建索引时，加入索引词 A，通过 XSDocument::addTerm 实现。那么将来搜索 catalog:A 就相当于包...

203.RE: xunsearch每天凌晨4点左右挂掉（log）

更新时间：2013-05-21 14:05 t By tendyming

没有特别去开进程来修改索引库阿. 我这里只是在数据有更新时才会执行性一次 --rebuild索引, 都是手工来做的. 我们现在的处理方式: 凌晨4:00 固定的去重起xunsearch, 如果没有做，凌晨4：00多就挂掉。很奇怪，每天都这样。。

...进行处理获取自己想要的信息呢？现在获取返回结果是这样的， a:2:{s:6:"status";s:2:"ok";s:5:"words";a:1:{i:0;a:5:{s:4:"word";s:12:"在线测试";s:3:"off";i:0;s:3:"len";i:12;s:3:"idf";d:8.19999980926513671875;s:4:"attr";s:1:"n";}}} 我如何用php从中提取出分词结...

205.RE: 我搜索真的很慢，求大神帮看看是什么问题

发布时间：2014-11-25 17:11 t By intsig

搜索其实是很快的，只是传输结果集实在是太慢了，个人觉得应该提供另外一种模式：先把要发送的所有记录或者部分记录打包，然后统一分段发送，这样可以减少发送端和接收端的网络io操作次数

206.RE: 请问一下，xdb与txt词库那个读取效率更高

发布时间：2013-07-03 16:07 t By hightman

但网址和EMAIL如果这样切，也太粗糙了吧。要全部匹配才能检索到，输入 EMAIL 的前段或网址的一部分均检索不到了。至于消除 HTML 标签，这不应该是分词的事哦

207.两种或以上的分词如何建索引，谢谢

更新时间：2014-05-04 17:05 t By binny_w

Hi All, 比如我有这样的需求：对标题的每个字作索引，再对SCWS分词作索引，如“快乐大本营”，则有[‘快’， ‘乐’， ‘大’， ‘本’， ‘营’， ‘快乐’， ‘大本营’]7种结果，这种自定义的分词器如何写？谢谢，我...

208.怎样才能字母数字汉字组合按照词典分成一个词语呢？

发布时间：2013-07-02 17:07 t By shuyinglee

...语；确认词典中没有这三个单独的词语；我的应用中这样的词语很多很多，希望能够整词匹配。我看了前面的一个帖子，说要修改源代码，请大侠指导一下，怎么修改？那个文件以及大概的行数, 非常感谢！！！！

209.RE: 有没有添加单个或多个词的函数？

发布时间：2010-07-29 15:07 t By backluck

...或某种其它方案把你的词库统一生成.XDB文件呀 [/quote] 这样做确实是可以，只是这时候文件就只是一个联系数据库和scws的一个中介，一个很临时的东西。我的意思是想可不可以绕过它。

210.三个问题需要求教

发布时间：2011-01-17 11:01 t By nftw

...文索引记录的时候，需要排除此类，但又会把像"LG集团"这样的例子给漏掉。 2，百分数会将数字与百分号分离，如5.7% 会分为 5.7+%,我希望的结果是将他们合为一体。有没有办法？ 3， GB2312编码中的繁体字不能正常分词，如“家...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

搜索