不太了解这个规则集的写法,请高手给讲解一下,谢谢 比如这个 [areaname2] :type = suffix :znum = 2 :exclude = noname,symbol,alpha,chnum2 :tf = 4.5 :idf = 3.0 :attr = ns :line = yes 东路 西路 支路 街道 南路 北路 分别是指什么意思呢?
请问下 我分了一个句子“小明从前门进来” 分成了 小明+从前+门+进来 请问该怎么调整“从前”和“前门”的词频才能正确的分出这句话呢? 还有那个TF-IDF两个权值是什么意思 怎么用
...好,我做了一个简易的词库,不想要那么多大的词库,为什么我导出词库重新生成之后会出一大堆错误,在make_xdb_file.php以下两行出错。 if ($v['part']) $flag |= 0x02; $data = pack('ffCa3', $v['tf'], $v['idf'], $flag, $v['attr']); 我的词库是UTF8...
...]=> float(4.11999988556) ["attr"]=> string(1) "n" } } 字典加载在什么时候都是返回 true 的. 这个异常在我不显式加载 字典的时候.就不会出现. 测试地址. http://116.252.185.149/fs360/ 我暂时不关闭调试结果.hightman 可以在" 综合" 那里 输...
...非法词汇。。。 [/quote][hr] 你好,请问你。utf8 的词库为什么用不上啊。还有 gbk 词库 和 utf8 的容量区别也很大。有没有跟gbk 编码的一样 utf8词库呢? [/quote] 基于SCWS自动分类演示:http://www.ftphp.com/scws/demo/a.php 请问一下这...
...非法词汇。。。 [/quote][hr] 你好,请问你。utf8 的词库为什么用不上啊。还有 gbk 词库 和 utf8 的容量区别也很大。有没有跟gbk 编码的一样 utf8词库呢?