scws分词后的直接做标签都有不错的效果了 :) 我理解其实就是搜索过程的一个反向 正常搜索就是 一句话 -> 分词 -> 搜索匹配 -> 输出 具体实现上 那匹配标签或者关键字这么做似乎也行 一句话 -> 分词 -> 搜索匹配 -> 前10个结果...
多谢建议。这个部分要做得精准的话其实是比较尖端的,SCWS分词后有提供一些热门词排序,如果简单归结为标签也是不妥的,我觉得需要有标签库进行匹配和比对。
我一直在研究怎么作一个合适的自动标签系统,国外已经有几个了,yahoo就提供了的,让你把文章发给它,它给你返回适合你文章的几个标签。 这对于帮助用户的文章归类很有意义,因为通常用户不能很好的自我归类。 我...
这个权重分配上 可以由参数定制化。 最基础的当然是共有标签,重复度,当然要剔除很基础的日常词汇,保留分类性的,这个不能简单由前10来实现,比如‘你好’被分词出来,而且频度很高,却不适合做标签的; 有些热门...
... 一、自己有近十万词的词库,我想使用自己的词库加上结合迅搜的系统词库,进行文章的tag提取,然后将搜索结果进行聚合。 二、搜索出的结果,能否进行伪静态的设置?
Xunsearch是我所见最好的中文开源搜索引擎了,我是drupal的使用者,如果xunsearch也能有drupal相结合的模块,那就好了。
Xunsearch是我所见最好的中文开源搜索引擎了,我是drupal的使用者,如果xunsearch也能有drupal相结合的模块,那就好了。