...项切割后以数组形式返回每一个词汇。它为中文而编写,支持 gbk 和 utf-8 字符集,适当的修改词典后也可以支持非中文的多字节语言切词(如日文、韩文等)。除分词外,还提供一个简单的关键词汇统计功能,它内置了一个简单...
...词汇、用户搜索日志基础上建立了一个庞大的纠错体系,支持英文拼写 纠错、中文同音字纠错、拼音转换等。 使用这些功能都非常简单,直接调用 [XSSearch::getCorrectedQuery] 即可,该方法接受搜索语句 作为参数,如省略参数则直...
...hp/lib/XS.class.php XS 组件基类 封装一些魔术方法, 以实现支持模拟属性 模拟属性通过定义读取函数, 写入函数来实现, 允许两者缺少其中一个 这类属性可以跟正常定义的属性一样存取, 但是这类属性名称不区分大小写. 例: $a = $o...
...法 public bool setUtf8() {return} bool MySQL 自 4.1.0 起支持字符集 源码: sdk/php/util/XSDataSource.class.php#L534 (显示) public function setUtf8(){ if (version_compare(mysql_get_server_info($this->link), '4.1.0', '>=')) { return @mysql_query("SET NAMES utf8",...
... 开发您自己的搜索了。 | | 目前只支持 PHP 语言,参见下面文档: | | /usr/local/xunsearch/sdk/php/README +
...v-delimiter[=,] 指定 csv 数据源的字段分割符,默认为逗号,支持 \t\r\n..\xNN 使用 \ 开头及其它与 shell 有岐议的分割符时请使用引号包围。 --file=当数据源为 json 或 csv 格式时指定数据源文件,默认读取标准输入 ...
...前测试过的有 RedHat Linux (as3,as4) FreeBSD 4.x 5.x 6.x。目前只支持 GBK 编码。 这个小程序的基本工作方式如下:运行后在本地绑定一个端口(缺省是 4700)监听处理分词服务,无其它功能。针对输入的文字进行分词后然后原样输出...
...最大上限,默认值均为 10 个。 对于普通搜索模式,还支持用 _--limit=offset,num_ 来同时指定偏移量和上限。 * _-d|--db _ 指定要搜索的数据库名称,默认是名为 db 的库, 多个库之间用逗号分隔。 * _--show-query_ 在搜索结果显...
...要是搜索速度快。后来由于hdwiki升级,而xungle对新版本的支持不太好。就一直没有用全文搜索,用的还是hdwiki自带的搜索(当然,流量有限) 上周末看了下xunsearch的教程,然后下了个VPS对应的centos 6.3 final在本地安装了一下,很...
... public mixed getCharset() {return} mixed 如果数据库不支持 UTF-8 转换则返回 false 源码: sdk/php/util/XSDataSource.class.php#L138 (显示) public function getCharset(){ if ($this->db->setUtf8()) { return 'UTF-8'; } return parent::getCharset();} ...