刚才顺便把前2个功能给实现了,下一版本就可用了。我把 patch 贴上来你可以自己打一下补丁然后重新编译即可。 [code] Index: libscws/scws.c RCS file: /home/cvsroot/scws/libscws/scws.c,v retri...
...为相关规范: - 文件为纯文本文件,编码必须是 UTF-8,可用任何编辑器修改 - 每行一条记录表示一个词,每行包含 1~4 个字段,字段之间用空格或制表符(\t)分隔 - 字段含义依次表示 “词语”,“词频(TF)”,“逆词频率(IDF)...
...erver 属性明细 allSynonyms 属性 只读 (自版本 v1.3.0 起可用) public array getAllSynonyms(int $limit=0, int $offset=0, bool $stemmed=false) 获取当前库内的全部同义词列表 correctedQuery 属性 只读 public array getCorrectedQuery(string $query=NULL) ...
...,该方法返回展开的搜索词组成的 数组,如果没有任何可用词则返回空数组。接受 2 个参数: * `$query` 要展开的搜索词,返回结果是以这个搜索词为前缀、拼音前缀展开,此为必要参数 * `$limit` 整数值,设置要返回的词数量...
...nt) 获取自定义词典内容 scwsMulti 属性 (自版本 v1.4.7 起可用) public int getScwsMulti()public XSIndex setScwsMulti(int $level) 获取当前索引库的分词复合等级 参见 setScwsMulti 方法明细 __destruct() 方法 public void __destruct() 源码...
...不断支持. 目前 scws 的版本为 1.0.0 Release , 该版本稳定可用,而且包含两个文本词典,和转化为 xdb 的工具, 词典编码为 gbk, 将 gbk 转换成 utf8 应该非常简单了, 这里不再细述, 详细情请下载整个软件包以后阅读其中的 README 文件. ...
...中 XSFieldScheme checkValid() 判断该字段方案是否有效、可用 XSFieldScheme getAllFields() 获取项目所有字段结构设置 XSFieldScheme getField() 获取项目字段元数据 XSFieldScheme getFieldBody() 获取内容字段元数据 XSFieldScheme ...
... $rs = $cws->segment($string); print_r($rs); // 其它可用方法介绍: // 设定词典路径 (后缀名为库类型,内置支持 sqlite txt cdb gdbm四个格式) ->set_dict($fpath); // 设定是否删除标点符号 ->set_ignore_mark($trueOR...
...ttp://www.hightman.cn/demo/scws/by_server.php[/url] (若服务没启动不可用) [b][size=3]安装说明[/size][/b] 1. 快速安装 (Linux/BSD ...) ./configure make make install 2. 使用 cscwsd -h 建议使用 cscwsd -D -L /tmp/cscwsd.log -d /usr/local/etc/dict.txt ...
...荐: 搭配 SCWS 面向 PHP 的全文检索解决方案 FTPHP/XUNGLE 已经可用 :)[/size][/b][/url] [url=http://bbs.xunsearch.com/showthread.php?tid=1241][b]SCWS-php4扩展 for win32 提供下载[/b][/url](由 ben 移植) 它是一套基于词频词典的机械中文分词引擎,它能将一...