...都较另外二者灵活. 在今天做测试时, 有遇到一个关于复合分词问题, 类似于"官方網站"这样的词汇, 默认配置下是作为单一词划出, 于是搜索"網站"时不可见. 如果设定-M 为 3 (0011) 可以解决这个问题, 但是在xunsearch中未找到此选...
... 蒂 芬 [b]罗铭罗 罗铭 铭罗[/b] 罗 铭 罗 大大 大 大 罗 [复合分词选项] 最短词 二元 重要单字 全部单字 加入自定义词库后结果为: 阿斯顿 阿斯 斯顿 阿 斯 顿 发 斯蒂芬 斯蒂 蒂芬 斯 蒂 芬 [b]罗铭 罗 铭 罗[/b] 大大 大 ...
...方法 public void __construct(string $arg=NULL) $arg string 复合等级参数,默认不指定 源码: sdk/php/lib/XSTokenizer.class.php#L188 (显示) public function __construct($arg = null){ if (self::$_server === null) { $xs = XS::getLastXS(); if ($xs === nu...
...如 ABCDEF => AB + ABCD + ABCDEF - scws([3]) 表示采用指定参数为复合等级的 scws 分词,(若无特殊复合需求,无需指定) ~~~ tokenizer = default ~~~ > note: 小括号内的值表示参数,中括号表示省略后的默认值,实际编写请勿照抄中...
...应指令 XSServer scwsMulti int 获取当前索引库的分词复合等级 XSIndex socket mixed 获取连接资源描述符 XSServer xs XS 服务端关联的 XS 对象 XSServer Protected 属性 隐去继承来的属性 名称类型描述定义于...
...;[/b][/color] [b]描述:[/b]设定分词执行时是否执行针对长词复合切分。(例如:中国人->中国+人+中国人)。 参数 mode 表示复合分词法的级别,取值由下面几个常量异或组合: SCWS_MULTI_SHORT | SCWS_MULTI_DUALITY | SCWS_MULTI_ZMAIN | SCWS_MULTI_ZA...
...:USERCASE 3. 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 4. 升级 libevent 到 2.x 版 5. 修正中文 stopwords 不生效的问题 6. 取消恼人的 NODB(S#506) 错误提示 7. 新增获取文档匹配词表的接口 XSSearch::setRequireMatchedTerm 官方网...
...参见 XSSearch::setCutOff 6. 改善搜索同义词处理方案,支持复合同义词及权重微调 7. 各种小 BUG 修正和及整体稳定性改进 8. 升级整合最新的 xapian-1.2.15、scws-1.2.2 官方网站:[url]http://www.xunsearch.com[/url] 下载地址:[url]http://www.xunse...
... -- [b]scws-1.2.2 发布于 2013-7-11[/b] 1) 改进中英夹杂的长词复合分法,比如 "奥迪A6/奥迪/A6" 2) 修正 pscws23 演示文件的一些写法与新版 PHP 不兼容 3) 修正一些 configure 检测错误 [b]scws-1.2.1 发布于 2013-1-15[/b] 1) 将源码迁移并托管到...
...么也会匹配包含 `finding` 或 `finds` 等同根词的结果。 - **复合词支持** 支持对多个单词组成的短语设置同义词,词之间用一个半角空格分开, 但同义词仍然只允许一个单词或中文词哦。如: 设置 `您好` 为 _hello world_ 的同义...