又一个分词错误。将“你用余额宝吗?为什么有人讨厌余额宝?”分成了 你 /r 用 /v 余额 /n 宝吗 /nr ? /un 为什么 /r 有人 /r 讨厌 /v 余额宝 /nz ? /un
...with scws?. 我是按照configure的显示错误一步步来说,说缺什么就装什么,我装了xapian-core ,请问这是什么问题?
学习中看到,程序对于英文字串的处理时,定义TF的值为 = 2.5×log(#wlen),词长的自然对数的2.5倍。有什么实际意义么? 为什么是这个值呢?
[quote='hightman' pid='5447' dateline='1387443918'] addRange 后会影响概率计算,count 会有问题 [/quote] 有什么什么方法能得出相对准确的count呢,数据量小时count没有问题,大的时候差别非常大
...跑的都正常。。 郁闷。。。[hr] 管理员,请问还有其他什么方法可以解决吗?[hr] 有没有什么办法,在其他机器上编译好了。直接拷贝到上面去运行啊? [/quote] 机器CPU架构不一样跨机编译的运行不了的,除非2边系统完全一...
...当一个词在baidu搜索中找到小于1000篇文章包含该词时,为什么要重新计算count,“21000 - $count * 18” 其中21000是什么?18是什么? 2、对tf的计算过程没明白为什么这么计算,还请赐教。 3、最后5000000000这个数是baidu的总索引量估...
...当一个词在baidu搜索中找到小于1000篇文章包含该词时,为什么要重新计算count,“21000 - $count * 18” 其中21000是什么?18是什么? 2、对tf的计算过程没明白为什么这么计算,还请赐教。 3、最后5000000000这个数是baidu的总索引量估...
...eight] => 9.76000022888 [attr] => nz融 ) attr是什么呢?而且,为什么是乱码。[hr] 对了斑竹,xdb可以修改么,我想向里面添加新词。