搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

发布时间：2010-07-14 17:07 t By hightman

..._extra.txt 也必须是UTF-8编码 4. 删除词条，因为陈凯歌其实可能是因为人名关系导致切成词，可能会不受词典影响 5. 如果你非要用gbk 源码中 set_charset() 的参数就为 'gbk' 或默认的不要加上 'utf8'

发布时间：2011-03-03 00:03 t By hit

导出TXT文件顺序是按照XDB里面的排列的 (我觉得导出文件可能有问题) 创建XDB文件是根据 foreach $rec[$k] 里面的数字排序的那样 XDB和TXT里面的排序完全改变了目前的情况是我导出TXT在创建XDB 分词速度比之前慢了2倍这...

发布时间：2013-05-09 18:05 t By hq22

...calhost/test --sql="select * from tbl_post" 很大的数据，索引时间可能几分钟。这样，我的mysql数据库会被锁住吗？就是不能读或者写了？还是单单执行sql语句的时间会锁住？因为这两个时间不一样，执行sql语句时间可能就1秒，而索引...

发布时间：2012-05-01 03:05 t By Dull

这个可能是什么原因呢？网页是gb2312编码项目配置是gbk 会不会是这个原因呢？

发布时间：2011-09-14 11:09 t By hightman

...P 是 5.1.6 版本确实比较早了，我们只测试了 5.2 5.3，所以可能存在少量不兼容，建议有可能升到 5.2+，因为从打印 "object id #2" 来看，确实对 __toString 支持存在一些问题。

发布时间：2014-05-05 16:05 t By yuangu125

这个统计的我也是不准，不明白什么原因，数字可能还好，这个中文搜索，精确匹配的，就是怪怪的。

发布时间：2012-08-27 13:08 t By hightman

最后一批数据可能会延迟提交的你用Indexer指令 --flush 看看

更新时间：2010-07-14 21:07 t By sulwan

..._extra.txt 也必须是UTF-8编码 4. 删除词条，因为陈凯歌其实可能是因为人名关系导致切成词，可能会不受词典影响 5. 如果你非要用gbk 源码中 set_charset() 的参数就为 'gbk' 或默认的不要加上 'utf8' [/quote] 我那个演示页面就是直接...

发布时间：2011-12-29 16:12 t By conglei1981

很多应用不可能纯中文啊，总会掺杂一些英文啊中英混合啊。不支持自定义词典中使用英文会有很大局限性啊

发布时间：2013-07-26 22:07 t By 特伦C

对于能够枚举出来的“1天”、“2天”……可以用自定义词库来解决，但对于如题所示的情况，组合太多，不可能在自定义词库里都枚举出来，所以想问下老大，是否有什么解决方案来达到这个效果？