搜索

大约有 20 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1996秒)

1.求解释TF/IDF计算器中get_tfidf的算法

发布时间:2013-10-30 11:10 t By jjyang

function get_tfidf($word, $count) { if ($count < 1000) $count = 21000 - $count * 18; $tf = log($count); $tf = pow($tf, 5) * log(strlen($word)); $tf = log($tf); $idf = log(5000000000/$count); //if ($tf > 13) $idf *= 1.4; return array($...

2.求解释TF/IDF计算器中get_tfidf的算法

发布时间:2013-10-30 11:10 t By jjyang

function get_tfidf($word, $count) { if ($count < 1000) $count = 21000 - $count * 18; $tf = log($count); $tf = pow($tf, 5) * log(strlen($word)); $tf = log($tf); $idf = log(5000000000/$count); //if ($tf > 13) $idf *= 1.4; return array($...

3.求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By zouhc

...样的: 辣椒油 13.45 9.22 n 我用计算器得出是这样的: WORD=辣椒油 TF=12.07 IDF=12.38 新制作的词输出为词典的时候没有作用,用你说的新词的TFIDF都用1的话,也没有作用,求老大指点。

4.求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By zouhc

...样的: 辣椒油 13.45 9.22 n 我用计算器得出是这样的: WORD=辣椒油 TF=12.07 IDF=12.38 新制作的词输出为词典的时候没有作用,用你说的新词的TFIDF都用1的话,也没有作用,求老大指点。

5.RE: 中文分组粗分方法

发布时间:2010-05-26 19:05 t By baobao

...用您发布的工具,把字典解压。得出了关于的词的字段 WORD TF IDF ATTR 当机立断 14.01 8.10 i WORD ATTR我都能理解。 上贴说的逐字分词后 计算权重的时候使用IDF,貌似就是类似基于字典的最大概率方式来定义权重,...

6.SCWS - rules.ini 规则集配置文件

发布时间:2007-06-07 20:06 t By hightman

...r ; $Id: rules.ini,v 1.3 2007/06/07 08:37:07 hightman Exp $ ; ; special word, 特殊词汇 ; [special] C++ .NET C# R&B S.H.E P&B ; ; nostats ; [nostats] about all also an and any are as at be but by both can for from have here if in is it no not of on or...

7.自定义词典产生的故障

更新时间:2012-04-29 20:04 t By yunxiaoad2

...了乱码: array(3) { ["off"]=> int(0) ["attr"]=> string(3) "@�" ["word"]=> string(15) "重庆鸡公煲" } array(3) { ["off"]=> int(0) ["attr"]=> string(3) "ns�" ["word"]=> string(6) "重庆" } array(3) { ["off"]=> int(6) ["attr"]=> string(3) "n�" ["word"]=> string(6) "鸡公" } array(3) ...

8.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

更新时间:2010-11-13 10:11 t By snakeyasin

...库中存在该词也视为无效。 2. [libscws] 新增 int scws_has_word(const char *xattr); 和 scws_top_t scws_get_words(const char *xattr); 两个函数 1. 参数 xattr 和 scws_get_tops 的参数是一样的,指定词性,多个词性之间用逗号(,)分隔,若以 ~ 开头则表...

9.PSCWS23 词典文件如何制作

发布时间:2011-11-28 11:11 t By alicar

PSCWS23 词典文件如何制作 xdb导入导出工具导出信息如下 ---------------------------------- # WORD TF IDF ATTR ---------------------------------- 除了表头,一个都没导出。。。。。。

10.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

发布时间:2012-11-06 22:11 t By umland

...库中存在该词也视为无效。 2. [libscws] 新增 int scws_has_word(const char *xattr); 和 scws_top_t scws_get_words(const char *xattr); 两个函数 1. 参数 xattr 和 scws_get_tops 的参数是一样的,指定词性,多个词性之间用逗号(,)分隔,若以 ~ 开头则表...

12
  • 时间不限
  • 按相关性排序