搜索

大约有 83 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2969秒)

71.scws-1.1.9 发布,明确采用 BSD 协议;改进复合分词修正BUG等

更新时间:2011-12-28 13:12 t By hightman

...的需求 3) 测试脚本自动加载当前目录下的 dict_user.txt 文本词典 4) 修正 scws.c 中 __PARSE_XATTR__ 宏的 BUG 导致 scws_get_tops 和 scws_get_words 的 xattr 参数工作不正常的问题 5) 移除 scws.c 中关于 jabberd2s10 的注释,已不包含它的代码 ...

72.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压不死锁)

发布时间:2013-03-28 12:03 t By vus520

...服务。 我现在的问题是想通过XSTokenizerScws来获取指定文本的自定义分词结果。sdk使用了github里最新的版本,词典格式由一楼所示,现在取出来的结果并不包含任何自定义词典的关键词,求解。[/code] [php] $text =

73.编写第一个配置文件

...第一个配置文件 `Xunsearch` 的配置文件是纯文本的 `INI` 格式,用任何文本编辑器均可编写,在 `Unix` 类型的系统下推荐 用 `vi`,而 `Windows` 下可以用记事本或 `EditPlus` 进行编写。我们也正在计划不久的将来制作一个 `W...

74.自定义 SCWS 词库

...库只要编辑该文件即可,以下为相关规范: - 文件为纯文本文件,编码必须是 UTF-8,可用任何编辑器修改 - 每行一条记录表示一个词,每行包含 1~4 个字段,字段之间用空格或制表符(\t)分隔 - 字段含义依次表示 “词语”,...

75.2007简易分词第4版(scws-0.1.x)体验

发布时间:2007-06-06 11:06 t By hightman

...分词目前的速度也超出了我的想象,实测 8万字节的中文文本在我的服务器上最快达 0.07秒(双核双CPU 3.0G),使用 php 扩展速度要略慢了 40% 左右,8万字节大概要 0.4~0.6秒不定。

76.[2013] SCWS-1.2.2 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

...索的需求 3) 测试脚本自动加载当前目录下的 dict_user.txt 文本词典 4) 修正 scws.c 中 __PARSE_XATTR__ 宏的 BUG 导致 scws_get_tops 和 scws_get_words 的 xattr 参数工作不正常的问题 5) 移除 scws.c 中关于 jabberd2s10 的注释,已不包含它的代码 6) ...

77.RE: scws1.1.8为什么第一次都很慢。

更新时间:2011-10-24 14:10 t By ci169

...慢了。相同的内容过后几次都超快。 [hr] 再测试一次,文本: SCWS 是 Simple Chinese Words Segmentation 的缩写,即简易中文分词系统。 ************** 第一次提交 ********************************* No. WordString Attr Weight(times) --------------...

78.xunsearch-1.2.0 (基于xapian/scws/php的开源中文全文搜索,自定义词库、搜索日志管理)

发布时间:2011-12-12 17:12 t By hightman

...ogger[/url] 2. 小修改大提升,支持自定义 SCWS 分词词典,文本格式。但旧有索引必须重建,新增的词汇才能生效。 [url]http://www.xunsearch.com/doc/php/guide/index.dict[/url] 3. 其它一些 PHP-SDK 工具和 API的修改: XSIndex 对象的各个方法...

79.Libscws C API 使用说明

更新时间:2010-12-30 22:12 t By hightman

... const char *text, int len);[/color][/b] [b]描述:[/b]设定要切分的文本数据,text 指定该串文本的起始位置,而 len 表示这段文本的长度。该函数可安全用于二进制数据,不会因为字符串中包括 \0 而停止切分。这个函数应该在 scws_get_result...

80.搜索全文时较慢,在0.5+秒,甚至1.0+秒【900M数据库】

更新时间:2013-07-05 15:07 t By chinapubmed

...-----+---------+----------------+ [/php] 数据库大小约900MB。全是文本。 # 配置文件 [php]project.name = pub project.default_charset = utf-8 ;服务端用默认值 ;server.index = 8383 ;server.search = 8384 [did] type = id [title] type = title [tag] index = self ...

  • 时间不限
  • 按相关性排序