看上去你的分词程序并没有成功加载词典。 你最好按照安装说明进行操作,不必复制DEMO.PHP,毕竟你的安装路径可能和我不一样。要依据词典路径的
这个应该没办法,所有的调整都是基于词典,也就是词典的优先级最最高了。 可以用程序扫出类似的词来删除它们,因为互联网语料库这些自动都列到词里了。
...因为你用错误词了,48.php 是针对UTF-8的,而你调用了gbk的词典,把你的词典语句改为 dict.utf8.xdb 即可 3. dict_extra.txt 也必须是UTF-8编码 4. 删除词条,因为陈凯歌其实可能是因为人名关系导致切成词,可能会不受词典影响 5. 如果...
这怎么是BUG呢,本来就是这样。只不过是在你没有任何词典的情况下它才默认加载默认词典。 并不是一开始就自动加载默认词典。。。
...试了下目前的多粒度分词,有一种情况不能实现 比如词典里有: 我们是中国人 我们是中国 我们是 中国人 中国 当要分句子: 我们是中国人 无论怎么设置,都无法分出 我们是中国 我们是 这些词 就是目前是按...
非常兴奋! 今天上来网站看,发现你已经做好了这个工具,还没测试,先赞一下。 站长真是给人意外惊喜,马上试试先。[hr] 发现以下错误,不过应该没有大问题,另我不是在命令行方式执行的: Notice: Undefined variable: mask in C:\...
... public void setCustomDict(string $content) $content string 新的词典内容 源码: sdk/php/lib/XSIndex.class.php#L495 (显示) public function setCustomDict($content){ $cmd = array('cmd' => XS_CMD_INDEX_USER_DICT, 'arg1' => 1, 'buf' => $content); $this->execCommand($cmd, XS_C...