搜索

大约有 70 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0074秒)

41.英文模糊搜索问题

发布时间:2013-07-31 10:07 t By homingway

...都失败了 1. 利用xs自带的scws,这个英文明显是根据空格分词的,所以达到效果 2. 自己写的一元/二元分词器,某些情况下可以正常工作,过有时会返回一些意想到的结果,而且相关度看起来并高,所以很困惑,最下方...

42.xunsearch-1.0.0 正式版 (基于xapian/scws/php的开源中文全文搜索引擎)

发布时间:2011-09-23 13:09 t By hightman

... C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 500 万网页大约 1.5TB 的数据中检索时间超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支...

43.RE: 官方和提供的下载一样,并且官方实例还写了错误代码

发布时间:2010-07-15 01:07 t By sulwan

...东西,对于索引要求比较高,墓前采用的办法是: SCWS分词,sphinx索引,减少索引,和增加的精确度,所索引专门提炼出来独立的数据库!

44.RE: [HELP]xunsearch安装好了,搜索没有结果集。。。

发布时间:2011-10-19 16:10 t By hpxl

...计有点问题。当type为string,没有指明index索引方式是是分词的。 [title] type=string index=both 和 [title] type=title 这两个字段设计效果一样。同样content,类型也有问题,可以这样 [content] type=body 或者 [content] type=string index=mixed 具体详看...

45.RE: 结合搜索引擎来制作自动标签系统

发布时间:2011-12-14 09:12 t By rogical

...分类性的,这个能简单由前10来实现,比如‘你好’被分词出来,而且频度很高,却适合做标签的; 有些热门的词汇,流行词汇,那种带有明显时效性可以加权,如‘凤姐’,‘芙蓉姐姐’, 有点类似百度风云榜的感觉; ...

46.xunsearch-1.4.1 (xapian+scws 开源搜索引擎,修正搜索进程死锁)

发布时间:2013-02-21 11:02 t By hightman

... C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持...

47.按字段值分面搜索

...件做筛选搜索, 支持分面的字段需要进行索引,而它的分词方式最好必须是 `full` 即整值索引。 用法详细示范 ----------- 以论坛文章搜索为例,每篇文章均属于同版块(字段为 fid)、同的发表年份 (字段为 year),我们需...

48.xunsearch-1.4.6 (基于 xapian 和 scws开源中文搜索引擎,高扛压再死锁)

更新时间:2013-03-27 13:03 t By hightman

.... 修改 XSTokenizerScws 以支持项目级自定义词典的 6. 自定义分词器的字段也能参与权重计算了,在 ini 指定 `non_bool = yes` 7. 采用 bootstrap 框架美化 util.SearchSkel 生成页面效果 官方网站:[url]http://www.xunsearch.com[/url] 下载地址:[url]h...

49.xunsearch-1.4.0 (基于xapian+scws的开源中文搜索,大幅改进性能及稳定性)

发布时间:2013-01-22 12:01 t By hightman

... C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持...

50.同义词搜索

...一个单词有多种同的形式,如:单复数、过去式和现在分词等。 而它们要传送的其实是同一种涵义。因此,对于纯英文的同义词记录会自动进行词根处理。 词根记录保存为大写字母 Z 开头的记录。例如: 设置 `find` 是 _s...

  • 时间不限
  • 按相关性排序