搜索

大约有 87 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0983秒)

41.自定义 SCWS 词库

...次表示 “词语”,“词频(TF)”,“逆词频率(IDF)”,“词性(ATTR)” - 后面三个字段如果省略依次使用 scws 的默认值 - 特殊词性 `!` 可用于表示删除该词 - 自定义词典优先于内置词典加载和使用,以 # 开头的行为注释 > note: ...

42.RE: 分词的关键词选择

发布时间:2010-02-26 17:02 t By hightman

你可以利用内置的 scws_get_tops 来获取权重和频率较高的词汇,可以根据词性排除

43.RE: 分词不对

更新时间:2010-04-30 13:04 t By hightman

呃确实存在,这都跟这个词库有关系,是互联网上整理的词库,像“法上”居然是专有名词而且权重很高。。。 可以考虑删除“法上”这个错误的词,外挂一个文本词典把“法上”标记为删除或设成更低权重及词性

44.RE: 请教关于文章标题分词

发布时间:2012-02-22 19:02 t By vanni

可以跟据词性在分词后自己过滤

45.RE: 如何去除无用的词?

发布时间:2013-04-28 14:04 t By hightman

这个就不是分词干的活呀,分词负责把词分了。 你可以自己根据词性去掉一些辅助类的词

46.RE: 如何去除无用的词?

发布时间:2013-04-28 14:04 t By hightman

这个就不是分词干的活呀,分词负责把词分了。 你可以自己根据词性去掉一些辅助类的词

47.RE: 神奇的 "附加" 一詞

发布时间:2013-08-15 11:08 t By hightman

是不是“附加”的词性变成了 un ?

48.RE: 请问如何只返回名词?

发布时间:2013-09-10 15:09 t By hightman

分词问题请到scws版问,自己根据词性过滤吧。

49.RE: 遇到一个分词错误的问题

发布时间:2014-02-11 14:02 t By robinjia

不知道还有没有其它更好的解决办法?不能改代码,也必须保留武这个姓。正在考虑加一条规则,可是我不懂那些词性语法规则的运作原理。

50.RE: 刚翻译了一下这个倒java上

发布时间:2011-03-09 12:03 t By hightman

词性参与计算校正确实反而引发了不少错误,这一点正在考虑。

  • 时间不限
  • 按相关性排序