搜索

大约有 30 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1971秒)

11.SCWS-php扩展的说明及用法

发布时间:2007-06-07 18:06 t By hightman

...e][/b] SCWS 是一个简易的分词引擎,它可以将输入的文本符串根据设定好的选项切割后以数组形式返回每一个词汇。它为中文而编写,支持 gbk 和 utf-8 字符集,适当的修改词典后也可以支持非中文的多字节语言切词(如日文、...

12.SCWS Flash移植版 - SCWS for Flash/AS3

更新时间:2013-10-29 22:10 t By Bruce_Jawn

...t:String):String //初始化scws后调用, //输入:待处理符串 //返回:分词处理过的符串,以空格作为分隔。 在线Flash演示原始页面, libscws.swc下载及SCWS for Flash/AS3源代码详见: http://bbs.9ria.com/thread-266835-1-1.html 源地...

13.批量分词问题

更新时间:2010-06-06 09:06 t By hide3088569

在循环中,对同一符串分词,会出现不同结果,请问这是什么原因导致?非常感谢! 使用扩展词库结果: 大连金龙钢丝绳 、钢丝绳扣 、合成纤维吊装带 -> 连金龙|成纤维| 大连金龙...

14.求救PSCWS4问题

发布时间:2010-07-21 10:07 t By FG2008

...ws/etc/rules_cht.utf8.ini'); // 分词调用 send_text() 将待分词符串传入, 紧接着循环调用 get_result() 方法取回一系列分好的词 // 直到 get_result() 返回 false 为止 // 返回的词是一个关联数组, 包含: word 词本身, idf 逆词率(重), off 在text...

15.项目配置文件详解

...为 default 采用内置的功能强大的 scws 分词,适合绝大多数符串字段。也可以指定自定义分词器, 格式为 name 或 name(arg) 两种形式,其中 name 是分词器名称,arg 则是传递给分词器构造函数的参数。 自定义分词器需要在 lib/...

16.在 Xunsearch 使用 SCWS

...分词结果 调用 [XSTokenizerScws::getResult] 对参数指定的文本符串执行分词, 并返回词汇数组,每个词汇包含 3 个元素,其中: - *off* 表示这个词汇在源参数文本 _$text_ 中的起始偏移位置 - *attr* 这个词汇的词性,使用北大标注...

17.Libscws C API 使用说明

更新时间:2010-12-30 22:12 t By hightman

...段文本的长度。该函数可安全用于二进制数据,不会因为符串中包括 \0 而停止切分。这个函数应该在 scws_get_result 和 scws_get_tops 之前调用。 [b]返回值:[/b]无 [b]错误:[/b]无。 [b]注:[/b]scws结构内部维护着该符串的指针和相...

18.修正utf-8版make_xdb_file.php的错误

发布时间:2011-06-09 09:06 t By itlong

...($word, 0, $len)切分中文会是乱码的。[/u] 所以要人为添加符串处理涵数,针对utf-8。 [php] function msubstr($str, $start=0, $length, $charset="utf-8", $suffix = false){ $suffixStr = $suffix ? '…' : ''; $re['utf-8'] = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0...

19.XSFieldMeta

...struct() 构造函数 XSFieldMeta __toString() 将对象转换为符串 XSFieldMeta fromConfig() 解析字段对象属性 XSFieldMeta getCustomTokenizer() 获取自定义词法分析器 XSFieldMeta hasCustomTokenizer() 判断当前字段是否采用自定义分...

20.同义词搜索

...使用[索引缓冲区](index.buffer)来提高效率。 参数 `$raw` 是符串,表示记录中的原词(标准词),`$synonym` 也是符串,表示记录中的同义词, 对于删除操作可以省略该参数表示清空原词的所有同义词。 以下为示例代码,其中...

123
  • 时间不限
  • 按相关性排序