搜索

大约有 24 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0057秒)

11.RE: 关键字完全匹配的如何增加权重?

发布时间:2012-11-05 13:11 t By hightman

[quote='hoffer01' pid='1494' dateline='1352060061'] 我改了一下,排除了专辑的干扰,第一次只在歌名里面做精准搜索: $docs = $search->search('song_name:\'\"大海\"\''); 这样搜出来的结果中,歌名最短的一定是完全匹配的。 [/quote] 引号就不用...

12.RE: scws_has_word的逻辑问题

发布时间:2010-07-29 14:07 t By hightman

关于has_word, 不是很明白你的意思, has_word 用于检测当前文本中是否包含这些属性的词。 scws_get_words 是按词性返回分词结果,标点的词应该默认应该是 un 或 # 之类可以自行排除

13.三个问题需要求教

发布时间:2011-01-17 11:01 t By nftw

...符号等都被视为un。我在插入全文索引记录的时候,需要排除此类,但又会把像"LG集团"这样的例子给漏掉。 2, 百分数会将数字与百分号分离,如5.7% 会分为 5.7+%,我希望的结果是将他们合为一体。有没有办法? 3, GB2312编码中...

14.RE: 搜索蜘蛛来抓取,导致搜索日志不正常,热门搜索一直是不相关的内容

发布时间:2012-03-09 10:03 t By hightman

自己改代码吧,在记录日志的时候排除来路为搜索引擎的。

15.RE: 请教:rules.ini的使用方法

发布时间:2010-09-22 09:09 t By hightman

...常用的姓,然后判断后面跟上1,2个字,并且这些字不在排除范围内的(一般不会用到名字里的字)那么就视为一个人名。大前提是这些都是散字,不在词库里。

16.RE: scws_has_word的逻辑问题

更新时间:2010-07-29 15:07 t By backluck

...词结果,标点的词应该默认应该是 un 或 # 之类可以自行排除。 [/quote] 关于has_word,我的意思是说,当我不传属性参数,返回的会是0

17.RE: 搜索蜘蛛来抓取,导致搜索日志不正常,热门搜索一直是不相关的内容

更新时间:2012-05-11 12:05 t By yunxiaoad2

'REQUEST_URI'是地址栏地址 你说的来路是referer[hr] 但是直接输入网址或收藏夹访问,也是来路为空的。 你不能排除有人直接把搜索结果页收藏起来吧?

18.RE: 我想过滤由‘人’‘得’‘到’‘直’ 这几个字组成的关键字

发布时间:2010-05-31 01:05 t By hightman

...设为 ! 即可。或者自己根据词性直接在取得返回值的时候排除它。。 因为你是包含的作法的话,是不是“人们”“人家”“人民”全都要过滤了??这样肯定不合适,所以建议直接根据词性过滤吧。这些无意义的词词性通常...

19.xunsearch-1.4.1 (xapian+scws 开源搜索引擎,修正搜索进程死锁)

发布时间:2013-02-21 11:02 t By hightman

...干已知的小 BUG 并改进一些显示效果 3. 搜索日志记录时排除具有明显特征的搜索引擎爬虫 官方网站:[url]http://www.xunsearch.com[/url] 下载地址:[url]http://www.xunsearch.com/download/xunsearch-full-latest.tar.bz2[/url] 代码仓库:[url]https://github....

20.最新的主要变动

...若干已知的小 BUG 并改进一些显示效果 - 搜索日志记录时排除具有明显特征的搜索引擎爬虫 版本 1.4.0 (2013-1-22) ---------------------- - 升级整合最新的 xapian-1.2.13、scws-1.2.1 - 新增支持项目自定义词库,[参见文档](index.dict) - 改进网络 ...

123
  • 时间不限
  • 按相关性排序