今天又在网站上重新下载了 简体utf8 xdb字典,和make_xdb 等软件,做次操作, xdb->txt 再txt->xdb 就不行了,直接报错! 麻烦版主测试一下,给一个修改字典的方法,谢谢!
...,坏处是会给相关性带来干扰 稍微正常的方法,去别的网站收集所有一字歌的汉字,导入,坏处是要记得更新 题外话,nutch默认就是单字索引,但为了单字要牺牲其他,比如最重要的相关性,你干吗?
我之前测试都是在自己的电脑上,可以安装SCWS的插件,但是我现在想把网站移植到都网络上,才发现虚拟服务器没有办法安装分词插件,那我还能有什么办法呀? 非常感谢!!
文档在网站首页很明显的啊。在这里,http://www.xunsearch.com/doc/php
[quote='hpxl' pid='343' dateline='1323690389'] 文档在网站首页很明显的啊。在这里,http://www.xunsearch.com/doc/php [/quote] 3Q
...的是,能不能取出像地名,人名,词语, 我想在一个网站中应该这些,请问有没有相关的案例可以看一下,谢谢各位,我的服务器是freebsd 大家能不能给一个解决方案
斑斑,网站原有的词库太大,而我做的东西只希望分出我想要词,在我定义范围外的就不分, 我定义了个词库,可是一用这个词库,就分不出来,数字和英文除外。 比如我定义“南瓜汤”,“番茄汤”作为一个词库,(测试用...
我在自己的网站上使用scws做分词,当文章中有类似PC-BSD之类有连字符的英文词时,都分成类“PC - BSD”,但这是个软件名,本不应分开,英文中加-号的一般都视为一个词,按理说不应分开的,有什么方法解决吗?