搜索

大约有 34 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1007秒)

11.求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By zouhc

老大,你提过的词典太老了,很多词语都没有。我想自己扩充我的词库,但不知道TF/IDF如何获得。 通过你提过的新词生词的TF/IDF计算器(http://www.xunsearch.com/scws/demo/get_tfidf.php) 结果计算出来的大部分内容都是一样的值,而...

12.求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By zouhc

老大,你提过的词典太老了,很多词语都没有。我想自己扩充我的词库,但不知道TF/IDF如何获得。 通过你提过的新词生词的TF/IDF计算器(http://www.xunsearch.com/scws/demo/get_tfidf.php) 结果计算出来的大部分内容都是一样的值,而...

13.求解释TF/IDF计算器中get_tfidf的算法

发布时间:2013-10-30 11:10 t By jjyang

function get_tfidf($word, $count) { if ($count < 1000) $count = 21000 - $count * 18; $tf = log($count); $tf = pow($tf, 5) * log(strlen($word)); $tf = log($tf); $idf = log(5000000000/$count); //if ($tf > 13) $idf *= 1.4; return array($...

14.求解释TF/IDF计算器中get_tfidf的算法

发布时间:2013-10-30 11:10 t By jjyang

function get_tfidf($word, $count) { if ($count < 1000) $count = 21000 - $count * 18; $tf = log($count); $tf = pow($tf, 5) * log(strlen($word)); $tf = log($tf); $idf = log(5000000000/$count); //if ($tf > 13) $idf *= 1.4; return array($...

15.提供rank接口?

发布时间:2012-04-02 00:04 t By Dull

addweight似乎还是不大够 比如实现比较复杂的算法addweight就麻烦些 象http://www.ruanyifeng.com/blog/it/ 里面提到的用户投票算法是实际中应用比较广泛的 专门做个排序字段rank当然也可以 会不会有性能问题 不如系统级别的好吧

16.RE: 关于匹配度

发布时间:2012-03-07 10:03 t By hightman

你的索引不止包含标题吧。这个匹配度是按 BM25 的算法公式来计算的。 见:[url]http://xapian.org/docs/bm25.html[/url]

17.期待

发布时间:2007-06-07 14:06 t By dinner3000

核心算法的源代码释出

18.分词改进需求

发布时间:2009-10-12 10:10 t By yanjing5462

...可能有5~1000吨,总不能一个一个都放进去,所以还是建议在算法上增加此功能比较理想

19.RE: 中文分组粗分方法

发布时间:2010-05-27 11:05 t By hightman

...参见:http://baike.baidu.com/view/1228847.html 并没有很固定的算法,SCWS中的tf/idf均经过特殊加工处理了

20.获取搜索结果

...~~ 设置排序方式 ----------- 默认情况,搜索结果根据内部算法计算相关度进行排序,采用著名的 `BM25` 算法,这在信息检索概率模型中表现 非常优秀,通常只要使用默认的算法即可。 通过 [XSSearch::setSort] 我们可以指定让搜索结...

1234
  • 时间不限
  • 按相关性排序