搜索

大约有 20 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0063秒)

1.请教为什么我这个无法分割成功啊?

发布时间:2011-07-05 20:07 t By cool

代码如下 $so = scws_new(); $so->set_charset('utf-8'); // 这里没有调用 set_dict 和 set_rule 系统会自动试调用 ini 中指定路径下的词典和规则文件 $so->send_text("我一个中国人");; while ($tmp = $so->get_result()) { foreach($tmp as $k=>$v){ echo $v['word'...

2.求解释TF/IDF计算器中get_tfidf的算法

发布时间:2013-10-30 11:10 t By jjyang

...当一个词在baidu搜索中找到小于1000篇文章包含该词时,为什么要重新计算count,“21000 - $count * 18” 其中21000什么?18什么? 2、对tf的计算过程没明白为什么这么计算,还请赐教。 3、最后5000000000这个数baidu的总索引量估...

3.求解释TF/IDF计算器中get_tfidf的算法

发布时间:2013-10-30 11:10 t By jjyang

...当一个词在baidu搜索中找到小于1000篇文章包含该词时,为什么要重新计算count,“21000 - $count * 18” 其中21000什么?18什么? 2、对tf的计算过程没明白为什么这么计算,还请赐教。 3、最后5000000000这个数baidu的总索引量估...

4.RE: 求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By hightman

...一起时需要消岐才用得到。你自定义词典用不了要查查什么别的原因。 通常问题: 1.词典写的字符集不对,比如把GBK当UTF-8了 2.词典更新后的修改时间由于某些原因比/tmp目录下生成的临时xdb还要旧,所以就不会更新。 你查...

5.scws 1.1.2 php extension安装的问题

发布时间:2010-06-12 17:06 t By vinwuser

...。这我php设置寻址有问题,还scws_set_dict()调词库需要什么权限或特定路径。 问题3的分词结果: Array ( [0] => Array ( [word] => 我 [off] => 0 [len] => 3 [idf] => 0 [attr] =...

6.RE: 中文分组粗分方法

发布时间:2010-05-26 19:05 t By baobao

...来定义权重,或者说对于歧义的取舍。 TF IDF 具体什么? 使用的概率计算公式能阐述下么? 谢谢。

7.使用自定义词库的时候,部分词会丢失

更新时间:2014-04-18 17:04 t By tianly

...工具以及scws-gen-dict来生成词库,但结果都一样。 有什么可能的原因吗? 谢谢 [hr] 我使用的代码如下, dict.utf8.xdb我自己的词库 //实例化分词插件核心类 $so = scws_new(); //设置分词时所用编码 $so->set_charset('utf8'); //设...

8.为什么程序消耗的内存越来越大

更新时间:2010-03-02 17:03 t By backluck

#include #include int main() { scws_t s; scws_res_t res, cur; char *text = "Hello, 我名字叫李那曲一个中国人, 我有时买Q币来玩, 我还听说过C#语言"; int i; if (!(s = scws_new())) { printf("error, can't init the scws_t!\n"); ...

9.Undefined index: part 的提示

发布时间:2011-02-09 23:02 t By hit

...141:$data = pack('ffCa3', $v['tf'], $v['idf'], $flag, $v['attr']); 为什么会出现这样的提示? 我txt这样写的 论坛 13.30 9.61 n 词语越长这种提示越多!

10.我爱康师傅牛肉面 分词有误

更新时间:2013-06-05 11:06 t By libin

...词也有问题. 我喜欢/n 吃/v 康师傅/n 牛肉面/n[hr] 大概知道什么原因了,我爱,我喜欢都在词库中标注为名词n 我爱 14.71 4.59 n 我喜欢 14.90 4.82 n 请问词库有问题还故意这样标注的?[hr] 你 1.28 0.00 r 我 1.28 ...

12
  • 时间不限
  • 按相关性排序