首先多谢选择使用 xunsearch ,像你这样的站是比较典型的,方便的话可以留下网址。 搜索性能 0.5 秒应该是首次检索,第二次检索同样的关键词缓存应该会起作用。 再说一下如何分库 像你这样的贴子,应该说旧贴子不太可能...
...,而且多个搜索分类之间是或的关系。例如:搜索语句是这样的:(jsid1:102102 OR jsid2:102102 OR jsid3:102102 OR (jbigsid1:102 AND jsid1:0) OR (jbigsid2:102 AND jsid2:0) OR (jbigsid3:102 AND jsid3:0) OR jsid1:106108 OR jsid2:106108 OR jsid3:106108 OR (jbigsid1:106 AND jsid1:0)...
...带一些例子 [/quote] 如果是页面结构相似的网页,像H大这样做更好。 [/quote] 结构相似的网页的话,也可以做单机程序,或者bat的文件去处理,但是没办法做到H大这样的,增量索引的功能
...p://bbs.xunsearch.com/showthread.php?tid=397 另外发现a.bb bb.a a.b.c这样的形式查询超慢无比 按照hightman的说法: [i]hightman(海? 15:28:33 . 是相当于加引号,连接符 hightman(海? 15:28:57 "a.b.c.d" 这样就要求 A后面紧跟B再紧跟C,D [/i] 于是...
...制符,应该在建索引时给预过滤可能更好。 \033[1;31;44m 这样的格式,用正则过滤掉就好了。此外,我看到了你默认搜索的是 2年内,所以可能效果上采用了 value compare (addRange)的所以效率比较慢。建议直接对时间字段建立年份索...
...目来说,这个数目是足够了。但是对tmall.com(taobao.com)这样的网站,对与叶子类别下的商品有不同特性的分面及过滤功能,要实现这样的功能,我的第一反应是放置不同的字段,255个字段会不够用。 对于scheme的相对动态是客户...
...路径肯定没错!! 但是还是调用不到啊!![hr] 现在是这样的情况,在本地,我测试了一下,程序没半点问题,能正常分词 我用FTP传到服务器上,却不行了 说明一下:所有文件编码都GBK,但是传到FTP上,用浏览器打开,却成...
...的不一样。 如:词典中的词语“辣椒油”在词典中是这样的: 辣椒油 13.45 9.22 n 我用计算器得出是这样的: WORD=辣椒油 TF=12.07 IDF=12.38 新制作的词输出为词典的时候没有作用,用你说的新词的TF和IDF都用1的话,也没有作...
...的不一样。 如:词典中的词语“辣椒油”在词典中是这样的: 辣椒油 13.45 9.22 n 我用计算器得出是这样的: WORD=辣椒油 TF=12.07 IDF=12.38 新制作的词输出为词典的时候没有作用,用你说的新词的TF和IDF都用1的话,也没有作...
... 官方能否在没个ini文件里面直接进行指定这个过滤器。 这样无论是通过管理工具,还是通过sdk 导入数据都可以默认掉用这个过滤器。 这样更便于整个项目的管理。 以后如果我想修改过滤规则,紧紧只需要修改一个文件就可...