目前没有方法,我看只有采集 http://www.ftphp.com/scws/demo/get_tfidf.php 这个地址。 希望可以共享一下
...行了: 3个XP(基本没运行什么) 1个Win7 (并且开了爬虫在采集) 1个CENTOS(就是我现在用来测试xunsearch的机器) -------------- 使用了[b]xunsearch 1.3.2[/b] 测试结果 [b]测试关键词一:杭州(第一次搜索)[/b] 大约有 302,502 项符合...
...攻关难点。 本分词法并无太多创新成分,采用的是自己采集的词频词典,并辅以一定的专 有名称,人名,地名,数字年代等规则识别来达到基本分词,经小范围测试大 概准确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引...
...攻关难点。 本分词法并无太多创新成分,采用的是自己采集的词频词典,并辅以一定的专有名称,人名,地名,数字年代等规则识别来达到基本分词,经小范围测试大概准确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎...