... 增加用户案例文档:USERCASE - 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch::setRequireMatchedTe...
在 Xunsearch 使用 SCWS 为了便于用户在安装完 `Xunsearch` 后可以通过服务端内置的 scws[1] 实现分词, 而不需要另外再安装 scws 的 php 扩展。从 `1.3.1` 版本起,`Xunsearch` 的 PHP-SDK 中加入 [XSTokenizerScws] 类,可通过搜...
自定义 SCWS 词库 如之前所说,我们所有的索引分词器默认为 scws,这也是我们开发的开源分词系统, 内置的词库基本上能满足绝大多数应用。但总有例外,这也就是即将说的如何自定义词库。 全局自定义词库 -----...
...### tokenizer 分词器 默认为 default 采用内置的功能强大的 scws 分词,适合绝大多数字符串字段。也可以指定自定义分词器, 格式为 name 或 name(arg) 两种形式,其中 name 是分词器名称,arg 则是传递给分词器构造函数的参数。 ...
...定义分词器 `Xunsearch` 默认内置了功能强大的 [SCWS][1] 分词系统,也附加提供了一些简单常见的分词规则, 但考虑到用户的个性需求,特意提供了自定义分词器的功能。 > note: 自定义分词器存在一个缺陷,它不支持存储...
...而悠久的 [Xapian][1],分词采用 自主研发同样也是开源的 [SCWS分词][2],两者完美结合,理论上单个搜索库支持 40 亿条 记录。可编译运行于 Linux/FreeBSD 等各种 UNIX 类型的系统。 *Xunsearch PHP-SDK* 是该项目的 PHP 语言开发工具包,面...
...虑中文名支持,所以建议这个字段保留使用默认内置的 `scws` 分词器。 由于希望在默认不指明字段的情况下也能检索作者字段,所以它的过索引方式应为 `both`。 - `authorid` 作者 ID,我们只用于搜索结果的作者链接,不需要索引...
...意思对于英文来说就是一个单词,对于中文来说必须是 `scws` 词库中的一个词。 > _Xunsearch_ 的同义词不同于 _Xapian_,会智能进行字段匹配和转换,您只需维护通用词库。 英文同义词的特殊处理 ------------------ 英文单词的同义...
...含安装所需求的全部组件的完整安装包(含 `xapian/libevent/scws`), 您只要下载并安装此完整安装包即可,具体操作步骤如下: 1. 运行下面指令[下载][2]、解压安装包 ~~~ wget http://www.xunsearch.com/download/xunsearch-full-latest.tar.bz2...
...->getSearch(); $index = $db->getIndex(); // 如有必要,还可以获得 scws 分词对象 $scws = $db->getScws(); ``` #### 使用 xunsearch DebugPanel 为便于调试,还提供了一个 `hightman\xunsearch\DebugPanel` 对象,可以集成到 debug 模块中, 可在调试工具条和面板...