搜索

大约有 116 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0999秒)

61.RE: 为什么xunsearch不用 Sphinx,而用Xapian呢?

发布时间:2012-10-25 20:10 t By fyland

... 此外xapian在IR方面做得更好,sphinx 索引创建速度确实比较快,但其它方面个人认为远不如 xapian。 sphinx 也缺少存储,还要配合原有的数据库协同工作,相当不方便。 [/quote] 能否提高xapian创建索引的速度?

62.多个addRange后getLastCount有问题

更新时间:2013-12-16 19:12 t By xilin

...$d1,$d2)这样写法会不会比上面的效率高?只是这种写法有时比较难写,因为有时要判断一些条件才能决定是否需要addRange

63.RE: 请教:rules.ini的使用方法

发布时间:2010-09-22 09:09 t By hightman

因为这个讲述起来比较复杂,而且多数用不到,所以一直缺这个文档。 rules.ini 是一个规则,比如像姓名或路名或章节数字之类,可以规定某些字凑在一起就视为整体,可以规定某些字开头或某些字结尾的N个字组成词组,基本...

64.RE: 新增 CHM 格式的离线文档下载(内含API、指南、关于)

发布时间:2011-09-24 15:09 t By hightman

MACOS比较 麻烦,因为正文UTF-8,目录是GBK,所以无法协同,我在MACOS用ICHM看好多文件时也出现过这个问题 。 下次把文件 统一用GBK编码可能 可以解决

65.RE: xunsearch安装完成后运行示例错误

发布时间:2011-09-14 11:09 t By hightman

...or_reporting(E_ALL ^ E_NOTICE); 第二,你的 PHP 是 5.1.6 版本确实比较早了,我们只测试了 5.2 5.3, 所以可能存在少量不兼容,建议有可能升到 5.2+,因为从打印 "object id #2" 来看,确实对 __toString 支持存在一些问题。

66.疑惑:分词数上限和标点符号控制

发布时间:2013-05-10 17:05 t By Brady.Li

...源项目真心实用,最近在使用一切顺利不过关于两个函数比较疑惑。 使用的是php_scws.dll (1.2.1) ,php扩展 其一: strpos($w['word'],"5) 参数limit,设置分词数上限,可否不控制上限?参数是什么 其二: set_ignore(bool yes) 参数:true...

67.RE: 请教hightman几个问题,请进

发布时间:2012-11-27 13:11 t By hightman

1)索引速度的慢其实是相对的,在一个大库里更新比较慢。但你可以变通分库,把最近的做成一个小库用以实时更新,再定期合并索引。 2)1亿条肯定要分库为佳,建议2000万左右一个库。可以联库索引,库也可是远...

68.RE: 我想使用系统自动的分词功能,可是只看到有接口

发布时间:2011-11-25 09:11 t By limingyao

...关系不大,如果没有这个功能的话,只有去另外安装。。比较麻烦

69.RE: 怎么分库才能优化好搜索性能?

发布时间:2011-11-07 13:11 t By hightman

首先多谢选择使用 xunsearch ,像你这样的站是比较典型的,方便的话可以留下网址。 搜索性能 0.5 秒应该是首次检索,第二次检索同样的关键词缓存应该会起作用。 再说一下如何分库 像你这样的贴子,应该说旧贴子不太可能...

70.RE: 对医院的分词不太理想

更新时间:2010-09-07 18:09 t By hightman

...致这个结果, 稍后我看能不能简单调整一下规则集来获得比较好的效果。 查到原因了,是因为词库里居然有个错误的词叫“民医院”!! 建议删除该词重新生成词典或,写一个附加词典标记为删除。内容如下,保存为名字 del.tx...

  • 时间不限
  • 按相关性排序