还有就是内存的问题,因为我希望在服务器端有个自动生成词库的功能,命令行方式不是很方便。 主要是用机器先自动分词,人工发现不合理,再把新词增加进去。
... //添加中文分词 $cws->send_text($a); dict_extra.txt 已经增加了一行:享鑫 1 1 n,但是“享鑫金属”还是只有金属被匹配出来
... 1.4.8 (2013-12-11) ---------------------- - 改进优化代码兼容性 - 增加用户案例文档:USERCASE - 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提...
...中 scws_get_tops 的 limit 参数不允许少于 10 的问题 3) libscws 增加 scws_fork() 从既有的 scws 实例产生分支并共享词典/规则集,主要用于多线程开发。 4) 新增部分版本的 win32 的 dll 扩展,详见下载页面 [b]scws-1.1.9 发布于 2011-12-26[/b] ...
...词,多条记录之间用逗号分割。您可以对同一个“原词”增加多个不同的“同义词”, 如果库内已存在完全一致的记录,则指令不起作用也不会报错。用法如下: ~~~ # 给 search 增加同义词 find util/Indexer.php demo --add-synonym search:fin...
...; $so->send_text($str); $sk = $so->get_result(); 这样,会得不到增加词库的效果, 必须: $so = scws_new(); $so->add_dict(LIB_DIR.'/scws/ext/dict.utf8.xdb');[b]//这里阿。。[/b] $so->add_dict(LIB_DIR.'/scws/phptool/dels.txt', SCWS_XDICT_TXT); $so->send_text($str); $sk...
...xdata() 批量提交索引命令封包数据 XSIndex addServer() 增加一个同步索引服务器 XSIndex addSynonym() 添加同义词 XSIndex beginRebuild() 开始重建索引 XSIndex clean() 完全清空索引数据 XSIndex close() 关闭索引服务端...