$so->set_dict('D:\php\scws\etc\dict.utf8.xdb'); $so->set_rule('D:\php\scws\etc\rules.utf8.ini'); $so->add_dict('D:\php\www\htdocs\dict_extra.txt', SCWS_XDICT_TXT); hm你好。 上边的代码的确可以自定义词库,现在的scws能否直接把词加入核心词库了啊?比如直接加...
HM,您好,我目前使用自定义词库实现分词,但是通过scws_get_top5()方法获取数据的时候(字母+数字大于等于3个的时候也会返回)。求过滤方案。 $sh = scws_open(); scws_set_charset($sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_...
自定义词库有些词无效。。 有的是3个以上的,有些是4个以上的,不定。。 ubuntu linux环境,自编译安装 比如顶置的例子我这里是这样的 ; dict_extra.txt 我是新增词 2.0 再试一个 1.0 1.0 @ ; 以下词为删除项 删除 ...
...另2项链接表示是否强制将词库加载到内存. 除TXT外只支持XDB格式的词库了。 2个函数的返回值均为 int,成功为1 失败是0。此外,词库的字符集必须和 scws_set_charset()指定的相匹配,以免出错。 ** 详解 TXT 词库的写...
...另2项链接表示是否强制将词库加载到内存. 除TXT外只支持XDB格式的词库了。 2个函数的返回值均为 int,成功为1 失败是0。此外,词库的字符集必须和 scws_set_charset()指定的相匹配,以免出错。 ** 详解 TXT 词库的写...
代码里特殊定义了这些字符不过滤,原因是跟搜索引擎配套开发时,这些字符都有特殊含义用于搜索,所以当时强制没有过滤。 下一版本会纳入,如需自行修改请按以下方式修改: [code] *** scws.c 8 May 2010 17:28:30 -0000 1.17 ...
txt词库其实也是转换成XDB再调用的,不用担心性能。 你合并词典很简单啊,把 dict.utf8.xdb 导出来嘛
...者的程序形成了sqlite的工具了,毕竟sqlite是PHP5开始默认支持的轻量级文本数据库引擎,也是不错的东西(关键是php5环境一般都支持) 附件是用txt生成sqlite词库的程序,用命令行方式运行! php make_sqlite.php dict.sqlite dict.txt 参...
[quote='hightman' pid='8876' dateline='1333164684'] txt词库其实也是转换成XDB再调用的,不用担心性能。 你合并词典很简单啊,把 dict.utf8.xdb 导出来嘛 [/quote] 谢谢hm。还是更加期望加上直接入字典库的功能。这样更加方便,就是不知...