搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

11.RE: 关键字完全匹配的如何增加权重？

发布时间：2012-11-05 13:11 t By hightman

[quote='hoffer01' pid='1494' dateline='1352060061'] 我改了一下，排除了专辑的干扰，第一次只在歌名里面做精准搜索: $docs = $search->search('song_name:\'\"大海\"\''); 这样搜出来的结果中，歌名最短的一定是完全匹配的。 [/quote] 引号就不用...

12.RE: scws_has_word的逻辑问题

发布时间：2010-07-29 14:07 t By hightman

关于has_word, 不是很明白你的意思, has_word 用于检测当前文本中是否包含这些属性的词。 scws_get_words 是按词性返回分词结果，标点的词应该默认应该是 un 或 # 之类可以自行排除。

13.三个问题需要求教

发布时间：2011-01-17 11:01 t By nftw

...符号等都被视为un。我在插入全文索引记录的时候，需要排除此类，但又会把像"LG集团"这样的例子给漏掉。 2，百分数会将数字与百分号分离，如5.7% 会分为 5.7+%,我希望的结果是将他们合为一体。有没有办法？ 3， GB2312编码中...

14.RE: 搜索蜘蛛来抓取，导致搜索日志不正常，热门搜索一直是不相关的内容

发布时间：2012-03-09 10:03 t By hightman

自己改代码吧，在记录日志的时候排除来路为搜索引擎的。

15.RE: 请教：rules.ini的使用方法

发布时间：2010-09-22 09:09 t By hightman

...常用的姓，然后判断后面跟上1，2个字，并且这些字不在排除范围内的（一般不会用到名字里的字）那么就视为一个人名。大前提是这些都是散字，不在词库里。

16.RE: scws_has_word的逻辑问题

更新时间：2010-07-29 15:07 t By backluck

...词结果，标点的词应该默认应该是 un 或 # 之类可以自行排除。 [/quote] 关于has_word，我的意思是说，当我不传属性参数，返回的会是0

17.RE: 搜索蜘蛛来抓取，导致搜索日志不正常，热门搜索一直是不相关的内容

更新时间：2012-05-11 12:05 t By yunxiaoad2

'REQUEST_URI'是地址栏地址你说的来路是referer[hr] 但是直接输入网址或收藏夹访问，也是来路为空的。你不能排除有人直接把搜索结果页收藏起来吧？

18.RE: 我想过滤由‘人’‘得’‘到’‘直’　这几个字组成的关键字

发布时间：2010-05-31 01:05 t By hightman

...设为 ! 即可。或者自己根据词性直接在取得返回值的时候排除它。。因为你是包含的作法的话，是不是“人们”“人家”“人民”全都要过滤了？？这样肯定不合适，所以建议直接根据词性过滤吧。这些无意义的词词性通常...

19.xunsearch-1.4.1 (xapian+scws 开源搜索引擎，修正搜索进程死锁)

发布时间：2013-02-21 11:02 t By hightman

...干已知的小 BUG 并改进一些显示效果 3. 搜索日志记录时排除具有明显特征的搜索引擎爬虫官方网站：[url]http://www.xunsearch.com[/url] 下载地址：[url]http://www.xunsearch.com/download/xunsearch-full-latest.tar.bz2[/url] 代码仓库：[url]https://github....

20.最新的主要变动

...若干已知的小 BUG 并改进一些显示效果 - 搜索日志记录时排除具有明显特征的搜索引擎爬虫版本 1.4.0 (2013-1-22) ---------------------- - 升级整合最新的 xapian-1.2.13、scws-1.2.1 - 新增支持项目自定义词库，[参见文档](index.dict) - 改进网络 ...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索