搜索

大约有 10 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2943秒)

1.scws-1.1.9 发布,明确采用 BSD 协议;改进复合分词修正BUG等

更新时间:2011-12-28 13:12 t By hightman

...确使用开源协议 New BSD License 发布新版本 2) 深度优化复合分词中的 SCWS_MULTISHORT 选项,更为合理有效,符合全文检索的需求 3) 测试脚本自动加载当前目录下的 dict_user.txt 文本词典 4) 修正 scws.c 中 __PARSE_XATTR__ 宏的 BUG 导...

2.XSTokenizerScws::setMulti

...法 public XSTokenizerScws setMulti(int $mode=3) $mode int 复合选项, 值范围 0~15 默认为值为 3, 可使用常量组合: SCWS_MULTI_SHORT|SCWS_MULTI_DUALITY|SCWS_MULTI_ZMAIN|SCWS_MULTI_ZALL {return} XSTokenizerScws 返回对象本身以支持串接操作 源码:...

3.请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)

发布时间:2012-02-23 17:02 t By Milton.Lai

...都较另外二者灵活. 在今天做测试时, 有遇到一个关于复合分词问题, 类似于"官方網站"这样的词汇, 默认配置下是作为单一词划出, 于是搜索"網站"时不可见. 如果设定-M 为 3 (0011) 可以解决这个问题, 但是在xunsearch中未找到此选...

4.scws-1.1.6 发布

更新时间:2011-04-20 15:04 t By hightman

...母单词之间时视为同一词而不再强行切开,此时如果激活复合分词的 DUALITY 选项,则仍能将符号切开作为复合词。 4.修正浮点数的识别规则,避免将IPv4地址识别为2个小数的尴尬,比如 192.168.1.1 以前会被切成 192.168 和1.1 2个数字...

5.项目配置文件详解

...如 ABCDEF => AB + ABCD + ABCDEF - scws([3]) 表示采用指定参数为复合等级的 scws 分词,(若无特殊复合需求,无需指定) ~~~ tokenizer = default ~~~ > note: 小括号内的值表示参数,中括号表示省略后的默认值,实际编写请勿照抄中...

6.最新的主要变动

...:USERCASE - 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch::setRequireMatchedTerm] 版本 1.4.7 (2013-7...

7.XSTokenizerScws

...nore() 设置忽略标点符号 XSTokenizerScws setMulti() 设置复合分词选项 XSTokenizerScws 方法明细 __construct() 方法 public void __construct(string $arg=NULL) $arg string 复合等级参数,默认不指定 源码: sdk/php/lib/XSTokenizer.clas...

8.关于扩展词库的问题

发布时间:2012-12-10 15:12 t By timeage

... 蒂 芬 [b]罗铭罗 罗铭 铭罗[/b] 罗 铭 罗 大大 大 大 罗 [复合分词选项] 最短词 二元 重要单字 全部单字 加入自定义词库后结果为: 阿斯顿 阿斯 斯顿 阿 斯 顿 发 斯蒂芬 斯蒂 蒂芬 斯 蒂 芬 [b]罗铭 罗 铭 罗[/b] 大大 大 ...

9.[2013] SCWS-1.2.2 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

... -- [b]scws-1.2.2 发布于 2013-7-11[/b] 1) 改进中英夹杂的长词复合分法,比如 "奥迪A6/奥迪/A6" 2) 修正 pscws23 演示文件的一些写法与新版 PHP 不兼容 3) 修正一些 configure 检测错误 [b]scws-1.2.1 发布于 2013-1-15[/b] 1) 将源码迁移并托管到...

10.Libscws C API 使用说明

更新时间:2010-12-30 22:12 t By hightman

...;[/b][/color] [b]描述:[/b]设定分词执行时是否执行针对长词复合切分。(例如:中国人->中国+人+中国人)。 参数 mode 表示复合分词法的级别,取值由下面几个常量异或组合: SCWS_MULTI_SHORT | SCWS_MULTI_DUALITY | SCWS_MULTI_ZMAIN | SCWS_MULTI_ZA...

  • 时间不限
  • 按相关性排序