[quote='hoffer01' pid='1494' dateline='1352060061'] 我改了一下,排除了专辑的干扰,第一次只在歌名里面做精准搜索: $docs = $search->search('song_name:\'\"大海\"\''); 这样搜出来的结果中,歌名最短的一定是完全匹配的。 [/quote] 引号就不用...
关于has_word, 不是很明白你的意思, has_word 用于检测当前文本中是否包含这些属性的词。 scws_get_words 是按词性返回分词结果,标点的词应该默认应该是 un 或 # 之类可以自行排除。
...符号等都被视为un。我在插入全文索引记录的时候,需要排除此类,但又会把像"LG集团"这样的例子给漏掉。 2, 百分数会将数字与百分号分离,如5.7% 会分为 5.7+%,我希望的结果是将他们合为一体。有没有办法? 3, GB2312编码中...
...常用的姓,然后判断后面跟上1,2个字,并且这些字不在排除范围内的(一般不会用到名字里的字)那么就视为一个人名。大前提是这些都是散字,不在词库里。
...词结果,标点的词应该默认应该是 un 或 # 之类可以自行排除。 [/quote] 关于has_word,我的意思是说,当我不传属性参数,返回的会是0
'REQUEST_URI'是地址栏地址 你说的来路是referer[hr] 但是直接输入网址或收藏夹访问,也是来路为空的。 你不能排除有人直接把搜索结果页收藏起来吧?
...设为 ! 即可。或者自己根据词性直接在取得返回值的时候排除它。。 因为你是包含的作法的话,是不是“人们”“人家”“人民”全都要过滤了??这样肯定不合适,所以建议直接根据词性过滤吧。这些无意义的词词性通常...
...干已知的小 BUG 并改进一些显示效果 3. 搜索日志记录时排除具有明显特征的搜索引擎爬虫 官方网站:[url]http://www.xunsearch.com[/url] 下载地址:[url]http://www.xunsearch.com/download/xunsearch-full-latest.tar.bz2[/url] 代码仓库:[url]https://github....
...若干已知的小 BUG 并改进一些显示效果 - 搜索日志记录时排除具有明显特征的搜索引擎爬虫 版本 1.4.0 (2013-1-22) ---------------------- - 升级整合最新的 xapian-1.2.13、scws-1.2.1 - 新增支持项目自定义词库,[参见文档](index.dict) - 改进网络 ...