搜索

大约有 30 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1967秒)

11.RE: 搜索蜘蛛来抓取,导致搜索日志不正常,热门搜索一直是不相关的内容

发布时间:2012-05-11 12:05 t By Mr.

...,似乎用户后者搜索引擎能通过别的域名访问的网站 比如在代码中配置的是www.xxxx.com,而蜘蛛通过无www的域名访问 过滤蜘蛛应该用user_agent [/quote] 我不会去用user_agent的 麻烦 全部蜘蛛都给判断一次? 其实知道这个$...

12.RE: 公司项目求助

更新时间:2012-03-07 10:03 t By hightman

...search 结合时作了很多特殊处理,保障查全率和准确率。 比如“管理制度” 解析为 “管理制度” OR “管理 AND 制度”

13.RE: 搜索语句超长

发布时间:2013-12-16 13:12 t By hightman

换一种方式解决啊,逐级添加父分类 比如一条数据的分类ID是 9,分类9的父ID是3,分类ID3的父分类是 1 那么给文档创建索引的时候,通过 $doc->addTerm() 给全部祖先分类ID:3,1 也建立索引不就好了。然后检索 3/1也能检索到分类...

14.RE: 求救 强制单字搜索 解决方法

发布时间:2012-03-03 15:03 t By yunxiaoad2

...外话,nutch默认就是单字索引,但为了单字要牺牲其他,比如最重要的相关性,干吗?

15.RE: 过了N秒了,还是搜索失败啊,大神们啊...

发布时间:2012-05-16 12:05 t By hightman

或者检查一下 tmp/index.log 看看是不是有什么出错,比如权限不对无法写入

16.RE: 搜索蜘蛛来抓取,导致搜索日志不正常,热门搜索一直是不相关的内容

发布时间:2012-05-11 08:05 t By yunxiaoad2

...,似乎用户后者搜索引擎能通过别的域名访问的网站 比如在代码中配置的是www.xxxx.com,而蜘蛛通过无www的域名访问 过滤蜘蛛应该用user_agent

17.RE: XSTokenizerScws的一个使用问题

发布时间:2013-01-30 14:01 t By hightman

...为一个词。 复合分词是对原本是词的长词情况处理的,比如”中国“可以切成”中“+”国“+”中国“ 的问题必须是 [code] $tk = $tokenizer->setDuality(false)->setIgnore(true)->setMulti(11)->getResult("是一"); [/code]

18.RE: 求救 强制单字搜索 解决方法

发布时间:2012-02-23 13:02 t By hightman

分词并不影响一字歌的搜索。只要库内有那个“词”。 比如:陈百强-不.mp3 这样分词的结果是 [color=red]陈百强 陈百 百强 不[/color] 这样搜索”不“,搜索”陈百强“,”陈百“,”百强“都可以搜索到,怎么会不能搜索单字呢...

19.RE: XSTokenizerScws的一个使用问题

发布时间:2013-02-02 13:02 t By tisswb

...为一个词。 复合分词是对原本是词的长词情况处理的,比如”中国“可以切成”中“+”国“+”中国“ 的问题必须是 [code] $tk = $tokenizer->setDuality(false)->setIgnore(true)->setMulti(11)->getResult("是一"); [/code] [/quote] 感谢指教...

20.RE: 【BUG】scws add txt dict 递归栈溢出问题?

发布时间:2013-06-09 13:06 t By hightman

是不是的 TXT 文件有问题,比如编码方面。TXT的资源指定成XDB肯定要出错啊

123
  • 时间不限
  • 按相关性排序