搜索

大约有 86 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0042秒)

41.RE: 中文分组粗分方法

发布时间:2010-05-27 11:05 t By hightman

...在各种语料中出现的机率权重。(越经常出现的越高) IDF是逆词频率,也就是说这个词更重要(因为罕见一些);具体参见:http://baike.baidu.com/view/1228847.html 并没有很固定的算法,SCWS中的tf/idf均经过特殊加工处理了

42.RE: 自定义的 txt 字典 有关问题 求助

发布时间:2010-04-09 15:04 t By hightman

...个属性对分词效果有一定影响的,TF主要用于词的切分,IDF用于统计,词性就用在取TOP时过滤或标注上。 最好是基于现有的词典去补充,你重建一个的话数据又都没有效果可能会比较差。SCWS主页上有一个TF/IDF计算器,你可以...

43.Undefined index: part 的提示

发布时间:2011-02-09 23:02 t By hit

...Undefined index: tf in Putdata.php on line 141 Notice: Undefined index: idf in Putdata.php on line 141 Notice: Undefined index: attr in Putdata.php on line 141 140:if ($v['part']) $flag |= 0x02; 141:$data = pack('ffCa3', $v['tf'], $v['idf'], $flag, $v['attr']); 为什么会出现这...

44.scws_set_multi复式分割无效

更新时间:2011-11-03 17:11 t By xjtdy888

...scws_get_result(s)) { while (cur != NULL) { printf("Word: %.*s/%s (IDF = %4.2f)\n", cur->len, text+cur->off, cur->attr, cur->idf); cur = cur->next; } scws_free_result(res); } scws_free(s); } [/code] 执行结果 [root@namenode-1 scws]# ./a.out Word: 上海市/ns (IDF = 7.82) [...

45.[特别发布] 纯PHP编写的xdb词典导入导出工具!!

发布时间:2009-07-01 17:07 t By hightman

...,每行一条记录,#开头表示注释,每条记录由 word、TF、IDF、Attr组成,其中TF是词频系数,IDF是逆词频率系数 而Attr是北大标注法的词性,这四个字段之间用\t隔开。 --- hightman 特别制作于 2009.7.1 下载地址:http://www.ftphp.com/...

46.为什么程序消耗的内存越来越大

更新时间:2010-03-02 17:03 t By backluck

...le (cur != NULL) { printf("Word: %.*s/%s (IDF = %4.2f)\n", cur->len, text+cur->off, cur->attr, cur->idf); cur = cur->next; } scws_free_result(res); } } scws_free(s); ...

47.规则集

发布时间:2011-11-10 01:11 t By clearchen

不太了解这个规则集的写法,请高手给讲解一下,谢谢 比如这个 [areaname2] :type = suffix :znum = 2 :exclude = noname,symbol,alpha,chnum2 :tf = 4.5 :idf = 3.0 :attr = ns :line = yes 东路 西路 支路 街道 南路 北路 分别是指什么意思呢?

48.PSCWS23 词典文件如何制作

发布时间:2011-11-28 11:11 t By alicar

PSCWS23 词典文件如何制作 xdb导入导出工具导出信息如下 ---------------------------------- # WORD TF IDF ATTR ---------------------------------- 除了表头,一个都没导出。。。。。。

49.关于词频的解释

发布时间:2013-04-12 10:04 t By jasonniu

请问下 我分了一个句子“小明从前门进来” 分成了 小明+从前+门+进来 请问该怎么调整“从前”和“前门”的词频才能正确的分出这句话呢? 还有那个TF-IDF两个权值是什么意思 怎么用

50.RE:1243

发布时间:2007-11-09 22:11 t By sanix

...跟以下结构一致。 struct scws_result { int off; float idf; unsigned char len; char attr[3]; scws_res_t next; };

  • 时间不限
  • 按相关性排序