怎么解决自定义词库的时候有的词还是会被拆分的问题?我自己定义了一个词库,我希望如果词库里面有的词会被完成的分出来,比如词是"帕萨特新领驭"被直接被拆成“帕萨特新领驭”,这个没问题。但是如果词是"帕萨特新领...
API中没有针对同义词库单独一个 独立词的获取 如:[hello world] => Array ( [0] => 你好 ) [search] => Array ( [0] => find [1] => seek ) 我要获取search 下面的同义词 每次都要全部...
...er.txt,还是会扫描、装载etc目录下所有的txt? 3、自定义词库后,系统内置词库是否同时还生效,还是只用用户自定义了? 4、能否在北大词性列表外和@外自定义词性,比如美食类、休闲类、餐厅名我想分别定义为:nms、nxx、nc...
...了复合分词且只用了【最短词】来复合 假定我的扩展词库中有:【球面抛光机】、【冰包餐桌】 没有扩展结果分别是: 【球面抛光机】 -> 球面、抛光机、抛光 【冰包餐桌】 -> 餐桌(idf:6.19) 使用扩展结果分别是: ...
我也发现是这样的问题,我现在最新1.1.7,自定义一个词库后(),原词库就没有用了。 比如: new.txt(这个文件里,试过一个词也没有、添加个别词两种情况); $so = scws_new(); //$so->add_dict('', SCWS_XDICT_TXT); $so->send_text('广州...
...'1264745243'] 2010年,scws 长了一岁,加上了翘首以盼的删减词库功能,该功能通过变通的办法解决,并非直接修改核心词库。下面详细介绍一下 scws-1.1.0 的更新日志及用法举例(示例以PHP扩展语言为例)。 -- [b]scws-1.1.3 发布于 201...
...'1264745243'] 2010年,scws 长了一岁,加上了翘首以盼的删减词库功能,该功能通过变通的办法解决,并非直接修改核心词库。下面详细介绍一下 scws-1.1.0 的更新日志及用法举例(示例以PHP扩展语言为例)。 -- [b]scws-1.1.3 发布于 201...
我有一自定义词库,用来文本中的非法词。譬如“美女” ,用scws_get_tops分出来的词中有这个词,但是scws_has_word却判断为不包含这个词。 但是大部分自定义词库中的词还是能用scws_has_word判断出来,而有些却有不可以,尤其是两...