问题是系统在使用自定义词库的时候,添加的词能不能算是基词?是否使用同义词的时候可以进行关联? 就目前的情况是添加了自定义词之后,如果这个词不算是基词,关联的同义词就无效、、、、
我也发现是这样的问题,我现在最新1.1.7,自定义一个词库后(),原词库就没有用了。 比如: new.txt(这个文件里,试过一个词也没有、添加个别词两种情况); $so = scws_new(); //$so->add_dict('', SCWS_XDICT_TXT); $so->send_text('广州...
问题是,我在现存的词上创建同义词,也不是无效的!!!不得不采用index search 的or 语法
不明白你说的。同义词是基于分词后的结果制作的。 如果你的索引先前制作,后面再添加自定义词,那么当然无效了。你要重建索引
有个问题想请教下hightman大大,似乎0.0.1-pre版本的词库增加了词性标注,这对我很有帮助。想请教一下如何把0.0.1-pre版本的dict.xdb转换成txt呢?我找到了您发布的scws-v23里面的mk_txt.php,但是好像和新版本的xdb词库不兼容,能否麻...
...er.txt,还是会扫描、装载etc目录下所有的txt? 3、自定义词库后,系统内置词库是否同时还生效,还是只用用户自定义了? 4、能否在北大词性列表外和@外自定义词性,比如美食类、休闲类、餐厅名我想分别定义为:nms、nxx、nc...
...'1264745243'] 2010年,scws 长了一岁,加上了翘首以盼的删减词库功能,该功能通过变通的办法解决,并非直接修改核心词库。下面详细介绍一下 scws-1.1.0 的更新日志及用法举例(示例以PHP扩展语言为例)。 -- [b]scws-1.1.3 发布于 201...
...'1264745243'] 2010年,scws 长了一岁,加上了翘首以盼的删减词库功能,该功能通过变通的办法解决,并非直接修改核心词库。下面详细介绍一下 scws-1.1.0 的更新日志及用法举例(示例以PHP扩展语言为例)。 -- [b]scws-1.1.3 发布于 201...
我目前使用自定义词库实现分词,但是通过scws_get_top5()方法获取数据的时候(字母+数字大于等于3个的时候也会返回)。求过滤方案。 $sh = scws_open(); scws_set_charset($sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_set_rule($sh, './r...
...txt', SCWS_XDICT_TXT); hm你好。 上边的代码的确可以自定义词库,现在的scws能否直接把词加入核心词库了啊?比如直接加进dict.utf8.xdb'?而不是这种方式 因为目前的词库比较大。用txt的话怕影响速度或性能一类的