function get_tfidf($word, $count) { if ($count < 1000) $count = 21000 - $count * 18; $tf = log($count); $tf = pow($tf, 5) * log(strlen($word)); $tf = log($tf); $idf = log(5000000000/$count); //if ($tf > 13) $idf *= 1.4; return array($...
function get_tfidf($word, $count) { if ($count < 1000) $count = 21000 - $count * 18; $tf = log($count); $tf = pow($tf, 5) * log(strlen($word)); $tf = log($tf); $idf = log(5000000000/$count); //if ($tf > 13) $idf *= 1.4; return array($...
想做自定义词库的功能。 哪位大侠,是否可以告知, http://www.xunsearch.com/scws/demo/get_tfidf.php 的算法。 谢谢
...便啊,如果写个脚本调用你的[url=http://www.ftphp.com/scws/demo/get_tfidf.php]在线TF/IDF算法工具[/url],恐怕上万条请求你的服务器招架不住啊。。。 老大你的词库更新的好慢啊,2010年十二月距离现在都一年了,何况互联网上每天都有...
目前没有方法,我看只有采集 http://www.ftphp.com/scws/demo/get_tfidf.php 这个地址。 希望可以共享一下
...计算器,你可以参看一下效果。 http://www.ftphp.com/scws/demo/get_tfidf.php
...过的新词生词的TF/IDF计算器(http://www.xunsearch.com/scws/demo/get_tfidf.php) 结果计算出来的大部分内容都是一样的值,而且也无法用于分词。 另外用这个计算器计算得到的TF和IDF值和词典中原先的不一样。 如:词典中的词语“...
...过的新词生词的TF/IDF计算器(http://www.xunsearch.com/scws/demo/get_tfidf.php) 结果计算出来的大部分内容都是一样的值,而且也无法用于分词。 另外用这个计算器计算得到的TF和IDF值和词典中原先的不一样。 如:词典中的词语“...
...[url=http://www.ftphp.com/scws/demo/v4.php]http://www.ftphp.com/scws/demo/get_tfidf.php [/url](用于新词添加时不知怎么设tf,idf的话) 基于SCWS自动分类演示:[url=http://www.ftphp.com/scws/demo/a.php]http://www.ftphp.com/scws/demo/a.php[/url](输入一段文字系统自动给出...
...[url=http://www.ftphp.com/scws/demo/v4.php]http://www.ftphp.com/scws/demo/get_tfidf.php [/url](用于新词添加时不知怎么设tf,idf的话) 基于SCWS自动分类演示:[url=http://www.ftphp.com/scws/demo/a.php]http://www.ftphp.com/scws/demo/a.php[/url](输入一段文字系统自动给出...