怎么解决自定义词库的时候有的词还是会被拆分的问题?我自己定义了一个词库,我希望如果词库里面有的词会被完成的分出来,比如词是"帕萨特新领驭"被直接被拆成“帕萨特新领驭”,这个没问题。但是如果词是"帕萨特新领...
...望hightman 能够指点一下,用什么方法可以添加上述2个自定义词呢? 1、在dict_user.txt 里添加了自定义词,系统不能提取到上面2个词 2、在 /etc/rules.utf8.ini里添加专业的词,我在 [special] 下添加了上述2个词,结果还是没能提取到 ...
代码如下: function getwords($string='第一个新增词', $ignore = true, $duality = false, $multi = 3) { this -> cws -> addDict('/res/category/dict_1.txt',SCWS_XDICT_TXT); var_dump($this -> cws ->hasWord("新增词","n")); $this -> cws -> setduality($duality); $this -> cws -> setignore($ig...
那我将自定义词典的方式变成利用scws提供的方法扩充内置词典,是否就能够让自定义词被search.log记录的可能性增大呢
... 建议如果用户自定了dict_user.txt也一并记录 因为用户自定义的词一般更贴近实际业务,对访客更有帮助和价值
自定义词时候出现问题 词太多apache死了 $sh = scws_open(); scws_set_charset($sh, 'gbk'); //scws_set_dict($sh, 'E:/luxilang/tool/keword/dict.txt'); scws_set_dict($sh, 'E:/luxilang/tool/keword/dict.txt', SCWS_XDICT_TXT); //scws_set_rule($sh, 'E:/luxilang/tool/keword/rules.ini'); $...