搜索

大约有 69 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0053秒)

11.RE: 问一下词典中的DF是怎么计算出来的?

发布时间:2009-06-24 20:06 t By hightman

当时似乎对idf纯粹是tf按100万的基数取对数

12.求解释TF/IDF计算器中get_tfidf的算法

发布时间:2013-10-30 11:10 t By jjyang

...baidu搜索中找到小于1000篇文章包含该词时,为什么要重新计算count,“21000 - $count * 18” 其中21000是什么?18是什么? 2、对tf的计算过程没明白为什么这么计算,还请赐教。 3、最后5000000000这个数是baidu的总索引量估值吗?在googl...

13.求解释TF/IDF计算器中get_tfidf的算法

发布时间:2013-10-30 11:10 t By jjyang

...baidu搜索中找到小于1000篇文章包含该词时,为什么要重新计算count,“21000 - $count * 18” 其中21000是什么?18是什么? 2、对tf的计算过程没明白为什么这么计算,还请赐教。 3、最后5000000000这个数是baidu的总索引量估值吗?在googl...

14.RE: Xunsearch 并发占用资源如何计算

发布时间:2013-08-15 21:08 t By HiLinz

我主要面临搜索项目上线前服务器选择,如Xunsearch官网上性能测试上提到的数据量:100万数据,数据库大小为8.1G,如果日访问量100万用户,那服务器配置要什么标准呀?对CPU、内存、硬盘I/0 有什么要求?请指教。谢谢。最好给个...

15.RE: 冒昧的问一下——怎么用tf和idf来计算权重?

发布时间:2011-12-24 15:12 t By emo

同求! 凑字。。。

16.RE: 求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 16:05 t By zouhc

感谢H大回复,好像是你说的这个问题。 曾经我以为这个scws是国外高人开发的,最近才发现国内的牛人。作为苦逼的程序一员,你就是我心中的刘德华了。

17.RE: 冒昧的问一下——怎么用tf和idf来计算权重?

发布时间:2012-05-21 16:05 t By markmx

目前没有方法,我看只有采集 http://www.ftphp.com/scws/demo/get_tfidf.php 这个地址。 希望可以共享一下

18.RE: 求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By hightman

TF/IDF值不会导致用不到分词,只是靠在一起时需要消岐才用得到。你自定义词典用不了要查查是什么别的原因。 通常问题: 1.词典写的字符集不对,比如把GBK当UTF-8了 2.词典更新后的修改时间由于某些原因比/tmp目录下生成的临...

19.RE: 冒昧的问一下——怎么用tf和idf来计算权重?

发布时间:2012-02-22 18:02 t By vanni

同样问题: 新建的词典如何设置权重 比如:相宜本草 (某化妆品品牌) 被分成: 相宜 本草 我通过词典增加的 “相宜本草” 但是不管用 mydict.txt 文件内容如下: 1 相宜本草 2 雅漾 3 舒护 4 活泉水 # scws -A ...

20.RE: 分词问题

更新时间:2010-10-14 21:10 t By hightman

...multi,不过鉴于该词先单字后多字,所以达不到“云“+”计算“的效果。 使用 txt 附加词典时请显式地先指定 xdb 词典,以便 txt 词典后生效。 $so->add_dict('dict.xdb', SCWS_XDICT_XDB); $so->add_dict('dict.txt', SCWS_XDICT_TXT); [color=red]$so->set_multi...

  • 时间不限
  • 按相关性排序