搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0054秒)

91.RE: [HELP]xunsearch安装好了,搜索没有结果集。。。

发布时间:2011-10-19 16:10 t By hpxl

...计有点问题。当type为string,没有指明index索引方式是是不分词的。 [title] type=string index=both 和 [title] type=title 这两个字段设计效果一样。同样content,类型也有问题,可以这样 [content] type=body 或者 [content] type=string index=mixed 具体详看...

92.RE: 结合搜索引擎来制作自动标签系统

发布时间:2011-12-14 09:12 t By rogical

...分类性的,这个不能简单由前10来实现,比如‘你好’被分词出来,而且频度很高,却不适合做标签的; 有些热门的词汇,流行词汇,那种带有明显时效性可以加权,如‘凤姐’,‘芙蓉姐姐’, 有点类似百度风云榜的感觉; ...

93.自定义词库如何使用?

发布时间:2013-05-12 11:05 t By hq22

网页设计 分词后变成 网页设计 网页 设计 我想把网页设计就分为网页设计一个词,不需要搜索出含有网页跟设计的内容。 我在dict_user.txt加入 网页设计 这个词,好像并没有效果,还是搜索出来含有网页跟设计的文档。

94.xunsearch-1.4.7 (基于 xapian+scws 的开源中文搜索引擎,诸多细节改进)

发布时间:2013-07-30 11:07 t By hightman

... C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持...

95.RE: 这个不支持英文词典和中英文混合词典啊

发布时间:2012-02-22 19:02 t By vanni

如果只要文章中有Linux出现就算是Linux相关文章的话,其实是不需要分词了,直接用全文搜索Linux就好了。 只是SCWS目前看前来它的自定义词典不支持超过3个字,如果可以的话,可以通过自定义“Linux优化”来指定分词

96.RE: scws分词碰到连字符的词处理的问题

发布时间:2010-06-24 11:06 t By hightman

这个目录SCWS是按分开处理的, 主要是考虑了搜索实用性, 呵呵. 如果你要它连在一起, 得修改一下代码, 修改  libscws/scws.c 然后重新编译  [code] *** scws.c Sun May 9 01:16:11 2010 --- scws.c.condj Thu Jun 24 11:00:20 2010 *************** *** 326,342 **** ...

97.共享自己的drupal模块出来,drupal commerce + xunsearch 做出强大的中文搜索,丢掉solr吧

发布时间:2014-03-11 01:03 t By drupal anywhere

今天旗下的http://www.anetb.com需要一个支持中文分词搜索页,原drupal的太烂了, 我的做法是:结合xunsearch实现drupal commerce下的中文搜索 测试页:http://www.anetb.com/tsearch/demo/commerce/search.php , 可输入“奶粉”,我的站准备做这...

98.啥时候可以针对 split(|) 分割的字段进行分面搜索

发布时间:2014-07-23 10:07 t By xunsearch飞吧

分类分词 tokenizer = split(|) 这样的存进文档里,这样可以实现多个分类的 分面查询吗? 之前有篇帖子加 addTerm 或者 以split(|) 分割的2种方法,我试了下,不能解决分面搜索的统计结果! 没办法,又试了下,我结合以split(|) 分...

99.按字段值分面搜索

...件做筛选搜索, 支持分面的字段需要进行索引,而它的分词方式最好必须是 `full` 即整值索引。 用法详细示范 ----------- 以论坛文章搜索为例,每篇文章均属于不同版块(字段为 fid)、不同的发表年份 (字段为 year),我们需...

100.RE: xunsearch安装成功,索引也显示成功,但是无法搜索

发布时间:2013-08-22 20:08 t By czhlxd

...ype = title tokenizer = full 求指点 [/quote] type=title的貌似分词必须用默认的吧 tokenizer = full 这个去了

  • 时间不限
  • 按相关性排序