搜索

大约有 20 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0059秒)

1.分词之后能否加入上下文算法

发布时间:2014-06-27 22:06 t By dd201077

分词之后能否加入上下文算法,再去查询

2.在PPC等处理器上测试SCWS分词算法,不能正确分词

发布时间:2013-05-28 10:05 t By tiankong

问题:我在PPC等处理器上测试scws,发现都不能正确分词。 例如将“乒乓球拍卖完了”分词后结果为: WORD: 乒/un (IDF = 0.00) WORD: 乓/un (IDF = 0.00) WORD: 球/un (IDF = 0.00) WORD: 拍/un (IDF = 0.00) WORD: 卖/un (IDF = 0.00) WORD: 完/un (IDF = 0.00) W...

3.RE: 在PPC等处理器上测试SCWS分词算法,不能正确分词

发布时间:2013-05-30 15:05 t By hightman

词库的字节序原因,你可以在 ppc 处理器上重新用 bin/gen-scws-dict 制作一份词库就可以了。

4.hightman你好,请问有没有好的相关度算法推荐下?

发布时间:2008-04-03 15:04 t By routerpipe

你好,您的分词插件很好,但有个问题,我用这个插件做的相关度插件,实践中相关度并不大。 例如“你给我买的衣服“ match "你看的书" 和"一件衣服" 代码匹配出来相关度最大的是"你看的书",因为有2个词相同,而按照我...

5.RE: 求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By hightman

TF/IDF值不会导致用不到分词,只是靠在一起时需要消岐才用得到。你自定义词典用不了要查查是什么别的原因。 通常问题: 1.词典写的字符集不对,比如把GBK当UTF-8了 2.词典更新后的修改时间由于某些原因比/tmp目录下生成的临...

6.求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By zouhc

...果计算出来的大部分内容都是一样的值,而且也无法用于分词。 另外用这个计算器计算得到的TF和IDF值和词典中原先的不一样。 如:词典中的词语“辣椒油”在词典中是这样的: 辣椒油 13.45 9.22 n 我用计算器得出是这样...

7.求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By zouhc

...果计算出来的大部分内容都是一样的值,而且也无法用于分词。 另外用这个计算器计算得到的TF和IDF值和词典中原先的不一样。 如:词典中的词语“辣椒油”在词典中是这样的: 辣椒油 13.45 9.22 n 我用计算器得出是这样...

8.分词改进需求

发布时间:2009-10-12 10:10 t By yanjing5462

...吊,二手16吨吊车,二手25吨吊车 15千克压力机 使用scws分词后: 转让 二手 徐工 汽车吊 , 二手 16 吨 吊车 , 二手 25 吨 吊车 15 千克 压力机 分词非常准确,基本能满足需求,美中不足的是: 25吨,16千克 不能分成整体的词,如...

9.中文分组粗分方法

发布时间:2010-05-26 12:05 t By baobao

你好Hightman: 我是一名大学生,对中文分词很感兴趣。 在网上看了很多关于中文分词的课件和论文。 词的粗分有几种: 最大匹配法 最大概率法 最短路径法 未登录词识别方法 等等 我下PSCWS4,学习了好久算法,由于个人...

10.2007简易分词第4版(scws-0.1.x)体验

发布时间:2007-06-06 11:06 t By hightman

...专名自动识别,也支持UTF-8/GBK等不同字符集。经评估测试分词准确率在 95% 左右,召回率有 92% 以上。 这套程序的开发其实很早就开始做基础工作了,持续时间和耗费精力都相当大。开始全部采用纯 php 代码编写,功能基本实...

12
  • 时间不限
  • 按相关性排序