搜索

大约有 321 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1963秒)

201.xdb文件读取小BUG

发布时间:2011-11-15 15:11 t By scgywx

...offset超过文件大小就会失败),程序还会继续往下执行,这样下面的代码执行将会报错。

202.RE: 建议能否增加一个检索过滤接口 SetFilter

发布时间:2012-02-27 10:02 t By hightman

其实在 xunsearch 的世界里,你的情况完全可以这样作。。。。 假设分类字段 catalog ID为 A 下的子分类为 AA,AB,AC ... 那么你给子分类的数据建索引时,加入索引词 A,通过 XSDocument::addTerm 实现。 那么将来搜索 catalog:A 就相当于包...

203.RE: xunsearch每天凌晨4点左右挂掉(log)

更新时间:2013-05-21 14:05 t By tendyming

没有特别去开进程来修改索引库阿. 我这里只是在数据有更新时才会执行性一次 --rebuild索引, 都是手工来做的. 我们现在的处理方式: 凌晨4:00 固定的去重起xunsearch, 如果没有做, 凌晨4:00多就挂掉。很奇怪,每天都这样。。

204.获取返回结果后如何处理

发布时间:2013-07-01 09:07 t By laiqn

...进行处理获取自己想要的信息呢? 现在获取返回结果是这样的, a:2:{s:6:"status";s:2:"ok";s:5:"words";a:1:{i:0;a:5:{s:4:"word";s:12:"在线测试";s:3:"off";i:0;s:3:"len";i:12;s:3:"idf";d:8.19999980926513671875;s:4:"attr";s:1:"n";}}} 我如何用php从中提取出分词结...

205.RE: 我搜索真的很慢,求大神帮看看是什么问题

发布时间:2014-11-25 17:11 t By intsig

搜索其实是很快的,只是传输结果集实在是太慢了,个人觉得应该提供另外一种模式:先把要发送的所有记录或者部分记录打包,然后统一分段发送,这样可以减少发送端和接收端的网络io操作次数

206.RE: 请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-07-03 16:07 t By hightman

但网址和EMAIL如果这样切,也太粗糙了吧。要全部匹配才能检索到,输入 EMAIL 的前段或网址的一部分均检索不到了。 至于消除 HTML 标签,这不应该是分词的事哦

207.两种或以上的分词如何建索引,谢谢

更新时间:2014-05-04 17:05 t By binny_w

Hi All, 比如我有这样的需求: 对标题的每个字作索引,再对SCWS分词作索引, 如“快乐大本营”,则有[‘快’, ‘乐’, ‘大’, ‘本’, ‘营’, ‘快乐’, ‘大本营’]7种结果, 这种自定义的分词器如何写? 谢谢, 我...

208.怎样才能 字母数字汉字组合 按照词典分成一个词语呢?

发布时间:2013-07-02 17:07 t By shuyinglee

...语; 确认词典中没有这三个单独的词语; 我的应用中这样的词语很多很多,希望能够整词匹配。 我看了 前面的一个帖子,说要修改源代码,请大侠指导一下,怎么修改? 那个文件以及大概的行数, 非常感谢!!!!

209.RE: 有没有添加单个或多个词的函数?

发布时间:2010-07-29 15:07 t By backluck

...或某种其它方案把你的词库统一生成.XDB文件呀 [/quote] 这样做确实是可以,只是这时候文件就只是一个联系数据库和scws的一个中介,一个很临时的东西。我的意思是想可不可以绕过它。

210.三个问题需要求教

发布时间:2011-01-17 11:01 t By nftw

...文索引记录的时候,需要排除此类,但又会把像"LG集团"这样的例子给漏掉。 2, 百分数会将数字与百分号分离,如5.7% 会分为 5.7+%,我希望的结果是将他们合为一体。有没有办法? 3, GB2312编码中的繁体字不能正常分词,如“家...

  • 时间不限
  • 按相关性排序