搜索

大约有 20 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1958秒)

1.求解释TF/IDF计算器中get_tfidf的算法

发布时间:2013-10-30 11:10 t By jjyang

function get_tfidf($word, $count) { if ($count < 1000) $count = 21000 - $count * 18; $tf = log($count); $tf = pow($tf, 5) * log(strlen($word)); $tf = log($tf); $idf = log(5000000000/$count); //if ($tf > 13) $idf *= 1.4; return array($...

2.求解释TF/IDF计算器中get_tfidf的算法

发布时间:2013-10-30 11:10 t By jjyang

function get_tfidf($word, $count) { if ($count < 1000) $count = 21000 - $count * 18; $tf = log($count); $tf = pow($tf, 5) * log(strlen($word)); $tf = log($tf); $idf = log(5000000000/$count); //if ($tf > 13) $idf *= 1.4; return array($...

3.求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By zouhc

...,很多词语都没有。我想自己扩充我的词库,但不知道TF/IDF如何获得。 通过你提过的新词生词的TF/IDF计算器(http://www.xunsearch.com/scws/demo/get_tfidf.php) 结果计算出来的大部分内容都是一样的值,而且也无法用于分词。 另外...

4.求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By zouhc

...,很多词语都没有。我想自己扩充我的词库,但不知道TF/IDF如何获得。 通过你提过的新词生词的TF/IDF计算器(http://www.xunsearch.com/scws/demo/get_tfidf.php) 结果计算出来的大部分内容都是一样的值,而且也无法用于分词。 另外...

5.RE: 求TF/IDF算法。

发布时间:2011-12-26 16:12 t By hightman

那个也不太准,新词你统统设为1就可以了

6.RE: 大量添加新词到词典时怎么设置TF/IDF

发布时间:2011-11-07 13:11 t By hightman

不知道就全设成1好了

7.RE: 求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By hightman

TF/IDF值不会导致用不到分词,只是靠在一起时需要消岐才用得到。你自定义词典用不了要查查是什么别的原因。 通常问题: 1.词典写的字符集不对,比如把GBK当UTF-8了 2.词典更新后的修改时间由于某些原因比/tmp目录下生成的临...

8.SCWS - rules.ini 规则集配置文件

发布时间:2007-06-07 20:06 t By hightman

...e = prefix :line = no :exclude = noname,symbol :znum = 1,2 :tf = 5.0 :idf = 3.5 :attr = nr 艾安贝卜戴费福盖戈古赫华霍吉贾金柯赖劳雷黎利林卢 鲁伦罗洛马麦米莫穆齐乔冉萨沙史斯温谢尤詹诸 [pubname2] :type = prefix :line = no :exclude = noname,s...

9.RE: 冒昧的问一下——怎么用tfidf来计算权重?

发布时间:2012-02-22 18:02 t By vanni

同样问题: 新建的词典如何设置权重 比如:相宜本草 (某化妆品品牌) 被分成: 相宜 本草 我通过词典增加的 “相宜本草” 但是不管用 mydict.txt 文件内容如下: 1 相宜本草 2 雅漾 3 舒护 4 活泉水 # scws -A ...

10.新手問題

更新时间:2010-07-29 13:07 t By user1000

1. 請問idf怎麼算呀?這有什麼意思? 2. send_text之後,PHP中怎麼看到tf呢?[hr] 请问xdb里的tf idf是那来的计数据呢?

12
  • 时间不限
  • 按相关性排序