scws分词后的直接做标签都有不错的效果了 :) 我理解其实就是搜索过程的一个反向 正常搜索就是 一句话 -> 分词 -> 搜索匹配 -> 输出 具体实现上 那匹配标签或者关键字这么做似乎也行 一句话 -> 分词 -> 搜索匹配 -> 前10个结果...
多谢建议。这个部分要做得精准的话其实是比较尖端的,SCWS分词后有提供一些热门词排序,如果简单归结为标签也是不妥的,我觉得需要有标签库进行匹配和比对。
我一直在研究怎么作一个合适的自动标签系统,国外已经有几个了,yahoo就提供了的,让你把文章发给它,它给你返回适合你文章的几个标签。 这对于帮助用户的文章归类很有意义,因为通常用户不能很好的自我归类。 我...
这个权重分配上 可以由参数定制化。 最基础的当然是共有标签,重复度,当然要剔除很基础的日常词汇,保留分类性的,这个不能简单由前10来实现,比如‘你好’被分词出来,而且频度很高,却不适合做标签的; 有些热门...
...过滤搜索结果的方法,可以将分面搜索看成搜索和浏览的结合。 如果您还是不清楚它的概念,敬请参阅[这篇文章][1]。 适用情况 -------- 在 `xunsearch` 中,分面搜索是按照字段的值来实现的,为了结合条件做筛选搜索, 支持分...
... 一、自己有近十万词的词库,我想使用自己的词库加上结合迅搜的系统词库,进行文章的tag提取,然后将搜索结果进行聚合。 二、搜索出的结果,能否进行伪静态的设置?
Xunsearch是我所见最好的中文开源搜索引擎了,我是drupal的使用者,如果xunsearch也能有drupal相结合的模块,那就好了。