搜索

大约有 70 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0078秒)

31.关于 SCWS 简易中文分词系统

更新时间:2013-01-10 16:01 t By hightman

...s][b][size=5][color=#FFA500]2010/01, scws-1.1.0 发布,支持加载文本词典,下载及介绍请进项目站点 http://www.xunsearch.com/scws[/color][/size][/b][/url] [url=http://www.xunsearch.com/scws][b]2008/12, scws-1.0.1 发布[/b][/url] [url=http://bbs.xunsearch.com/showthread.php?tid=12...

32.自定义 SCWS 词库

... xunsearch 服务端,那么每个服务端独自使用自己的自定义词典文件。 添加删除修改自定义词库只要编辑该文件即可,以下为相关规范: - 文件为纯文本文件,编码必须是 UTF-8,可用任何编辑器修改 - 每行一条记录表示一个词...

33.关于扩展词库的问题

发布时间:2012-12-10 15:12 t By timeage

... 斯 蒂 芬 [b]罗铭 罗 铭 罗[/b] 大大 大 大 罗 我的自定义词典为: 铭罗 1 0 n 罗铭 1 0 n 我的原意是想分出我的词典中所有的单词:“罗铭” “铭罗”,但加入到自定义词典后,却完全没有了“铭罗”这个词。 问题2...

34.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

更新时间:2010-11-13 10:11 t By snakeyasin

[quote='hightman' pid='3425' dateline='1264745243'] 2010年,scws 长了一岁,加上了翘首以盼的删减词库功能,该功能通过变通的办法解决,并非直接修改核心词库。下面详细介绍一下 scws-1.1.0 的更新日志及用法举例(示例以PHP扩展语言为例)...

35.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

发布时间:2012-11-06 22:11 t By umland

[quote='snakeyasin' pid='3834' dateline='1289616234'] [quote='hightman' pid='3425' dateline='1264745243'] 2010年,scws 长了一岁,加上了翘首以盼的删减词库功能,该功能通过变通的办法解决,并非直接修改核心词库。下面详细介绍一下 scws-1.1.0 的更新...

36.谁在windows下测试通过了,请给写个说明。谢谢了。我是这样做的,但是有错误。

发布时间:2010-10-30 20:10 t By wodeln

...这些我也都照做了。 建立一个本地目录放规则集文件和词典文件,建议使用:C:/program files/scws/etc 从 scws 主页上下载词典文件,解压后将 *.xdb 放到上述目录中 词典系列:http://www.ftphp.com/scws/down/scws-dict-chs-gbk.tar.bz2 ...

37.RE: scws1.1.2 安装错误

发布时间:2010-05-13 17:05 t By hightman

应该是分词词典没有正确加载。 如果你在php.ini中没有正确指定路径的话scws.default.fpath以及字符集 scws.default.charset 你应该在分词代码中明确指定这些 $s->add_dict(); 或 $scws->set_dict(); 还有 $scws->set_charset() 应该在此之前调用

38.scws-1.1.2 发布, 修正人名识别失败的问题

发布时间:2010-05-09 02:05 t By hightman

...仔细排查问题在于 scws 分词中。 当采用非内存模式的词典时,返回的查结结果中(word_st)...->flag的属性包含怕 SCWS_WORD_MALLOCED 与 SCWS_ZFLAG_SYMBOL 定义冲突,以至于被当作符号文字从而未能进行正确的人名识别。 现已经修正。详...

39.报告一个内存泄露bug,1.1.6版本

发布时间:2011-05-07 17:05 t By lauxinz

...内部函数应该是线程安全的,每一个线程可以共享同一个词典和rule。

40.XSTokenizerScws

...__construct() 构造函数 XSTokenizerScws addDict() 添加分词词典, 支持 TXT/XDB 格式 XSTokenizerScws getResult() 获取分词结果 XSTokenizerScws getTokens() XSTokenizer 接口 XSTokenizerScws getTops() 获取重要词统计结果 XSTokenizerScws g...

  • 时间不限
  • 按相关性排序