怎么解决自定义词库的时候有的词还是会被拆分的问题?我自己定义了一个词库,我希望如果词库里面有的词会被完成的分出来,比如词是"帕萨特新领驭"被直接被拆成“帕萨特新领驭”,这个没问题。但是如果词是"帕萨特新领...
嗯。词库我看到了,我是想在这个基础上做加入一些新的自己的就可以,您的这个支持,动态词库吗? 还有请问哪里能下载到,你的词库原文件。没编译过的。[hr] 我看到scws的代码都集成到xapian的queryparser中了,我想直接加入新...
...有的词库太大,而我做的东西只希望分出我想要词,在我定义范围外的就不分, 我定义了个词库,可是一用这个词库,就分不出来,数字和英文除外。 比如我定义“南瓜汤”,“番茄汤”作为一个词库,(测试用的,只放2个词...
还有,现在自定义了几个词库,分别是9M、7M,24k 看到文档说,这个文件读取后放在临时目录,建议不要太大,但我不知道多大才叫大,可否有个具体数据指导? 另外,这些新词,我通过官方提供的get_tf.php查询了一百个词,...
如果你还需要原来的词典,请在 add_dict 前加 set_dict(ini_get('scws.default.fpath').'/dict.utf8.xdb');
版主您好,我在自定义词表里加了一些数字+字母的词,如pm2.5,101大楼这样。 使用的时候发现无法正常分出来,我看到新版是加了一些强制拆分的功能,但是对自定义词表里的词,也是强制拆分的码?
我也发现是这样的问题,我现在最新1.1.7,自定义一个词库后(),原词库就没有用了。 比如: new.txt(这个文件里,试过一个词也没有、添加个别词两种情况); $so = scws_new(); //$so->add_dict('', SCWS_XDICT_TXT); $so->send_text('广州...