...Url依然使用的baidu,如下: // 获取语料库中包含该词的文档数 function get_count( $corpusUrl, $word) { $url = $corpusUrl . urlencode($word); $data = @file_get_contents($url); if (!$data) return -1; $pos1 = @strpos($data, "百度为您找到相关...
...~ 第一时间升级到最新版了。我有一个疑问,找了一些文档,没有找到相当的说明,希望你有时间能帮我解答一下。 现在自定义分词,是不是只能在索引的时候进行,我的项目中需要对内容进行自动分词,用于生成文章的t...
... 在本机安装也很顺利,。 不过。。编码用的UTF8 按照文档里面的demo也自己做个小东西。。试试。。。 然后。。 $words = scws_get_words($sh,'~un,nr'); 随便找一段文字,来分词 词性除了un和nr之外,就剩不下中文字了。。 。。 ...