...y()//[color=#0000CD]这里打印出是[/color][color=#FF0000]null[/color] 为什么是null呢?这样就查不出东西啦 help~~~:huh::huh::huh: --------------------------------- [num] type=numeric tokenizer = none index = none 这是索引配置文件 求助~~~~ ...
我用的是 "陈凯歌并不是《无极》的唯一著作权人,一部电影的整体版权归电影制片厂所有" 这段话,不知道为什么就只能分割出来陈凯歌,如果是分词没起作用的话就不会分割出陈凯歌的,这到底是为什么呢?麻烦高人帮帮我吧
为什么 +“合同法” -“浙江省” 有效, 而 +“合同法” -“省” ,+“合同法” -“浙江” 都无效?后者还是会出来带省和浙江的内容。 而词典里 浙江省 ,浙江,省 这几个词条都是存在的, 有没有什么办法让+“合同法...
通常英文是不需要分词的,但很多时候词性是需要的,比如nike,dior这类品牌英文。 目前默认词性都是en,有什么办法可否自定义词典来改变他的词性。 还有个问题,就是纯数字的词性为什么是en呢,不是m? 望赐教。
学习中看到,程序对于英文字串的处理时,定义TF的值为 = 2.5×log(#wlen),词长的自然对数的2.5倍。有什么实际意义么? 为什么是这个值呢?
我很愤怒,这是为什么了? xunsearch 好? 好在哪里? 搭建简单,使用方便。 那为什么愤怒了? 那个不稳定啊。。。 我在百度搜Unexpected respond in search {CMD:129, ARG:514} 搜到的结果相当多 可见用xunseaerch的网站很多 更可见搜索进程死...
...、当一个词在baidu搜索中找到小于1000篇文章包含该词时,为什么要重新计算count,“21000 - $count * 18” 其中21000是什么?18是什么? 2、对tf的计算过程没明白为什么这么计算,还请赐教。 3、最后5000000000这个数是baidu的总索引量...
...、当一个词在baidu搜索中找到小于1000篇文章包含该词时,为什么要重新计算count,“21000 - $count * 18” 其中21000是什么?18是什么? 2、对tf的计算过程没明白为什么这么计算,还请赐教。 3、最后5000000000这个数是baidu的总索引量...
...88 [attr] => nz融 ) attr是什么呢?而且,为什么是乱码。[hr] 对了斑竹,xdb可以修改么,我想向里面添加新词。
...与词重是怎么计算的,单位是什么,词重是什么含义呢?为什么相同的词频,词重会有差别,如表中“新浪” 词重为6.26 还有,在实际应用中,是不是不用管词频的具体值,只用知道其大小关系就行了? PS:看到之前有的发...