...text/html;charset=utf-8"); // 建立分词类对像, 参数为字符集, 默认为 gbk, 可在后面调用 set_charset 改变 $pscws = new PSCWS4('utf-8'); $pscws->set_ignore('yes'); $pscws->set_dict('E:/scws/etc/dict.utf8.xdb'); $pscws->set_rule('E:/scws/etc/rules_cht.utf8.ini'); // 分...
...数名 $long string 长参数名 $extra bool 是否补用默认顺序的参数 {return} string 返回可用的参数值,若不存在则返回 null 源码: sdk/php/util/XSUtil.class.php#L161 (显示) public static function getOpt($short, $long = null, $extra = false){ ...
...到一个关于复合分词问题, 类似于"官方網站"这样的词汇, 默认配置下是作为单一词划出, 于是搜索"網站"时不可见. 如果设定-M 为 3 (0011) 可以解决这个问题, 但是在xunsearch中未找到此选项. 请问可否在xunsearch中设置? 先谢过! ...
...arch` 服务端和 SDK API 通讯时没有加密和验证处理, > 并且默认情况 `xs-ctl.sh` 启动的服务程序是绑定并监听在 `127.0.0.1` 上。 > > 如果您的 SDK 调用和 `xunsearch` 服务端不在同一服务器,请使用 -b inet 方式启动脚本, > 并注意借助类...
...段索引词包含中文字符,则它的编码必须与整个项目的 > 默认字符集 [XS::defaultCharset] 一致。 > > 此外删除操作和[添加文档](index.add)一样,也是一个异步行为。 $Id$
...同样是在命令行模式下运行(需要安装 mbstring 扩展) 默认是处理 gbk 编码的文本,如果你的文本是 utf8,则需要修改该程序的第一行,把 define('IS_UTF8_TXT', false); 改为 true php make_xdb_file.php [导入的文本文件] --- 关...
...class XSTokenizerUnary implements XSTokenizer { private $length = 1; // 默认切分长度 public function __construct($arg = null){ if ($arg !== null && $arg !== '') $this->length = $arg; } public function getTokens($value, XSDocument $doc=null){ $charset = is_object($doc) ? $d...
...用XS.php这个文件呢? require的话会提示报错 我是安装在默认目录 /usr/local/xunsearch的 但是我使用 require '/usr/local/sdk/php/lib/XS.php'; 会提示require() [function.require]: Failed opening required '/usr/local/sdk/php/lib/XS.php' 小白一个求指点一二 [/q...
...英文、中文 $limit int 需要返回的搜索词数量上限, 默认为 10, 最大值为 20 {return} array 返回搜索词组成的数组 源码: sdk/php/lib/XSSearch.class.php#L755 (显示) public function getExpandedQuery($query, $limit = 10){ $ret = array(); $limit =...
...说明各项的情况,最底下还给出最终裁定意见。 > tip: 默认输出的字符集为 `UTF-8`,如果您的运行结果乱码, > 请尝试在运行命令末尾加上 `-c gbk` 。 ~~~ Xunsearch PHP-SDK 运行需求检查 检查内容 -------- 本程...