还有就是内存的问题,因为我希望在服务器端有个自动生成词库的功能,命令行方式不是很方便。 主要是用机器先自动分词,人工发现不合理,再把新词增加进去。
...s->add_dict(ROOT_PATH."inc/spider/dict_extra.txt", SCWS_XDICT_TXT);//新增词库 $cws->set_ignore(true); //var_dump($cws); //添加中文分词 $cws->send_text($a); dict_extra.txt 已经增加了一行:享鑫 1 1 n,但是“享鑫金属”还是只有金属被匹配出来
...级整合最新的 xapian-1.2.13、scws-1.2.1 - 新增支持项目自定义词库,[参见文档](index.dict) - 改进网络 IO 读取,优化搜索内存运用等大幅提升性能和稳定性 - 净化服务端日志使记录更有价值 - 改进 util.Indexer 和 util.Quest 加入 --info 选项...
2010年,scws 加上了翘首以盼的删减词库功能,该功能通过变通的办法解决,并非直接修改核心词库。下面详细介绍一下 scws-1.1.x 的更新日志及用法举例(示例以PHP扩展语言为例)。 最新版下载地址:[url]http://www.xunsearch.com/scws/do...
...含 `finding` 或 `finds` 等同根词的结果。 存取项目自定义词库 ----------------- 您也可以通过命令行查看和修改项目的自定义词库,具体用法如下: ~~~ # 查看 demo 项目的自定义词库 util/Indexer.php demo --custom-dict # 将已有自定义词库...
...->send_text($str); $sk = $so->get_result(); 这样,会得不到增加词库的效果, 必须: $so = scws_new(); $so->add_dict(LIB_DIR.'/scws/ext/dict.utf8.xdb');[b]//这里阿。。[/b] $so->add_dict(LIB_DIR.'/scws/phptool/dels.txt', SCWS_XDICT_TXT); $so->send_text($str); $sk = $so...
...法 public string getCustomDict() {return} string 自定义词库内容 源码: sdk/php/lib/XSIndex.class.php#L484 (显示) public function getCustomDict(){ $res = $this->execCommand(XS_CMD_INDEX_USER_DICT, XS_CMD_OK_INFO); return $res->buf;} 获取自定义词典内容 ...