...容词代码a和副词代码d并在一起。 an 名形词 具有名词功能的形容词。形容词代码a和名词代码n并在一起。 b 区别词 取汉字“别”的声母。 c 连词 取英语连词conjunction的第1个字母。 Dg 副语素 副词...
...现在想做的是,在一个英文句子里提取其中词频比较高的名词。想到用自定义词典,自己整理英文词。但是发现一个问题。。比如hip pop这样也是一个名词,那现在自定义词典里肯定不能有空格的啊。老大能不能把这个也解决一...
...性之间用逗号分隔, 以~开头取反 如: 设为 n,v 表示只返回名词和动词; 设为 ~n,v 则表示返回名词和动词以外的其它词 $xattr {return} array 返回词汇数组, 每个词汇是包含 [times:次数,attr:词性,word:词] 源码: sdk/php/lib/XSTok...
呃确实存在,这都跟这个词库有关系,是互联网上整理的词库,像“法上”居然是专有名词而且权重很高。。。 可以考虑删除“法上”这个错误的词,外挂一个文本词典把“法上”标记为删除或设成更低权重及词性
scws总把数词+量词分成名词,如: 一道/n 两个/n 一记/n 能否通过调整数词的tf和idf达到如下的效果: 一/m 道/q 两/m 个/q 或者有其他解决从工具本身解决的办法 ------------------------------------ 我自己尝试调tf-idf都失败了,...
...问题源于 rules.ini 中的词性修正。当初把单个字的动词+名词重点提升了权重。 参见这贴子:http://www.hightman.cn/bbs/showthread.php?tid=575&page=1&highlight=hightman#pid3092 当初解决”结合成分子时“ ”学人家人肉“ 。。 之类,所以 ”生“...
...m=_ 统计词语出现频率?? /set stat=on (开始统计) /set attr=名词,动名词,...(只统计这些?) 中间收到的分词语句均不直接输出而等到最后一句再输出结果, 排好顺序?? 格式:词语\t次数\r\n /set stat=off (停止统计) 4. 编译选项 --ena...
...900万个词 = > 约 900 万个词 篇是量词,量词怎么和后面的名词分在一块呢? 2. 效果相当好 = > 效果 相 当好 不知道在词库中"相"的词性是什么,这里把"相"和"当"分开,却把"当"和"好"分在一块, 明显不是我们想要的结果.