...次表示 “词语”,“词频(TF)”,“逆词频率(IDF)”,“词性(ATTR)” - 后面三个字段如果省略依次使用 scws 的默认值 - 特殊词性 `!` 可用于表示删除该词 - 自定义词典优先于内置词典加载和使用,以 # 开头的行为注释 > note: ...
呃确实存在,这都跟这个词库有关系,是互联网上整理的词库,像“法上”居然是专有名词而且权重很高。。。 可以考虑删除“法上”这个错误的词,外挂一个文本词典把“法上”标记为删除或设成更低权重及词性
不知道还有没有其它更好的解决办法?不能改代码,也必须保留武这个姓。正在考虑加一条规则,可是我不懂那些词性语法规则的运作原理。