...么问题或建议都可以记录在这。 对于检索部分,光有分词还是远远不够的,而且现在的全文检索已经不仅仅只是匹配、返回这么简单了,用户体验要求也高起来了。 布尔搜索、关键词联想、拼写纠错、拼音搜索、同义词、...
...为了按版块检索,我们必须对它进行索引,而它也不需要分词,所以分词器用内置的 `full`。 - `tid` 内容也是数字的主题ID,我们暂不考虑按主题搜索,所以不需要索引,也没有排序等要求,所以 只要当作普通字段存储下来即可...
... C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持...
支持多表搜索吗,以前用的是迅狗,后来用的织梦分词,最近刚发现有这个了,想试试。
...类。 我想XUNSEARCH是否可以实现, 文章发过来的,自动分词的基础上,得出最适合本文的标签。 这里可以按照权重来给标签来个排序,如:热门度,关联度,重复度等等。 如果xunsearch能出这么一个webservice就更好了。
我觉得scws的分词不错,但是xunsearch的搜索不是很符合我的要求, 我主要是数据库索引加搜索方面的,所以xs的索引建立是一大问题,看了一下貌似sphinx在这方面比较好,网上也看到过这样的案例,用sphinx+scws建立索引加分词,...
SCWS 全称是 Simple Chinese Words Segmentation 即简易中文分词系统。 [url=http://www.xunsearch.com/scws][b][size=5][color=#FFA500]2010/01, scws-1.1.0 发布,支持加载文本词典,下载及介绍请进项目站点 http://www.xunsearch.com/scws[/color][/size][/b][/url] [url=http://w...
[quote='alicar' pid='4034' dateline='1368603632'] cate:1,3,5 cate分词用逗号判断split(,) [/quote] 谢谢你提供的解决思路,我试了一下确实可行,但这种方法似乎并没有从根本上解决问题,如果我要查询的分类很多的话,比如30个,还是会报 D...