搜索

大约有 546 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0072秒)

251.RE: 第四版遇到()和中英文混合分词的问题。

更新时间:2009-06-14 03:06 t By JamesKG

我也遇到相同的問題。 不過我數字可以,但是[color=#0000CD]英文[/color]不能。 我是使用[color=#FF0000]繁體字庫[/color]。 版本是:php_scws.dll(2)/Windows/PHP 5.2.x [php] [/php] 結果在下面: [code] 原始文字:這個文件是為了...

253.scws-1.1.9 发布,明确采用 BSD 协议;改进复合分词修正BUG等

更新时间:2011-12-28 13:12 t By hightman

...用开源协议 New BSD License 发布新版本 2) 深度优化复合分词中的 SCWS_MULTISHORT 选项,更为合理有效,符合全文检索的需求 3) 测试脚本自动加载当前目录下的 dict_user.txt 文本词典 4) 修正 scws.c 中 __PARSE_XATTR__ 宏的 BUG 导致 scws...

254.xunsearch-1.3.1 (基于xapian/scws/php的开源中文全文搜索,新增分词SDK修正大量小BUG)

发布时间:2012-04-06 10:04 t By hightman

...发布 1.3.1 正式版,在 SDK 层面加入了许多用户诉求的 scws 分词接口,并修正了许多小 BUG,强烈建议所有用户升级到这个最新稳定版本。 [b]主要更新如下:[/b] 1. 增加基于搜索服务端的 XSTokenizerScws 便于直接使用 SCWS 的分词功...

255.关于 SCWS 简易中文分词系统

更新时间:2013-01-10 16:01 t By hightman

SCWS 全称是 Simple Chinese Words Segmentation 即简易中文分词系统。 [url=http://www.xunsearch.com/scws][b][size=5][color=#FFA500]2010/01, scws-1.1.0 发布,支持加载文本词典,下载及介绍请进项目站点 http://www.xunsearch.com/scws[/color][/size][/b][/url] [url=http://w...

256.RE: Hightman您好,我的分词怎么不对啊

更新时间:2010-08-19 14:08 t By hightman

改成这样,scws_open 本身是没有函数的,文档是正确的,但附带提供的 scws.php 写错了,所以如果 ini_get('scws.default.charset')是utf-8那么就会按utf-8来, 所以应该 显式的调用 scws_set_charset() $cws = scws_open(); scws_set_charset($cws, "gbk"); scws_set...

257.http-scws(基于scws的http协议中文分词) 更新至2.0版

更新时间:2011-06-27 20:06 t By smallevil

...只需一个命令即可使新词库生效 4.最大150K文本提交 5.可分词、提取高频词 6.支持GET与POST方式 7.支持短词、二元、主要单字、全部单字(基于scws功能) 8.支持标点过滤(基于scws功能) 简单测试结果: AMD 64位台式机四核CPU,程...

258.RE: scws1.1.8为什么第一次都很慢。

更新时间:2011-10-24 14:10 t By ci169

大佬。你看看啊。不快啊。 [b]第一次提交[/b] 分词结果(原文总长度 94 字符) (这次分词结果不对,点击汇报) No. WordString Attr Weight(times) ------------------------------------------------- 01. 加分 nz 9.46(1) 02. 考试题 ...

259.[求助]如何转换pre版本的xdb为txt格式

发布时间:2007-12-25 17:12 t By hackson

...坛主为开源事业所做出的杰出努力,现在网上发布的种种分词工具,绝大部分都只提供了控件或者插件而不直接提供源代码和分词词库,本人非常鄙视那些把分词技术归为秘密的人。共同学习才能共同提高,取长补短,分词是很...

260.RE: 遇到一个分词错误的问题

更新时间:2014-02-13 10:02 t By robinjia

...张”前面的“一”是一个量词的情况,这样可以解决这类分词错误的情况。

  • 时间不限
  • 按相关性排序