搜索

大约有 546 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1940秒)

281.中文分组粗分方法

发布时间:2010-05-26 12:05 t By baobao

你好Hightman: 我是一名大学生,对中文分词很感兴趣。 在网上看了很多关于中文分词的课件和论文。 词的粗分有几种: 最大匹配法 最大概率法 最短路径法 未登录词识别方法 等等 我下PSCWS4,学习了好久算法,由于个人...

282.安装scws分词扩展出现的问题

发布时间:2009-10-04 23:10 t By future123

系统环境:linux as5.0+httpd-2.2.11+mysql-5.0.56+php5.3.0+phpcms2008sp2+scws1.0.0 编译安装php5.3.0后找不到php.ini文件。于是找到系统自带的php rpm包,重新装了一遍,(之前编译安装的PHP5.3.0没有删除)然后vi /etc/php.ini ,把extension_dir设为空。...

283.daemon server(linux后台程序)和embed(库的形式嵌入程序中)

更新时间:2010-12-09 23:12 t By lauxinz

...n server指的是这个后台程序使用了scws库,且主要功能就是分词, embed指的就是一个程序使用了scws库,分词只是其中一个环节?daemon server也是embed啊。 另外不知道xdb和xtree性能差距有多大?xdb格式没有装入内存,只是在分词过程...

284.XSIndex::setScwsMulti

... public XSIndex setScwsMulti(int $level) $level int 要设置的分词复合等级 {return} XSIndex 返回自身对象以支持串接操作 源码: sdk/php/lib/XSIndex.class.php#L331 (显示) public function setScwsMulti($level){ $level = intval($level); if ($level >= 0...

285.Libscws C API 使用说明

更新时间:2010-12-30 22:12 t By hightman

...33cc]0. 概述[/color][/size][/b] Libscws 代码是当前 SCWS(简易中文分词) 算法使用C语言编写的链接库,目前仅基于 Unix 族的操作系统,可能必须适当修改才能运行在 Windows 平台中。这套 scws 库没有外部扩展依赖,代码力争简洁高效,针对...

286.RE: [HELP]xunsearch安装好了,搜索没有结果集。。。

发布时间:2011-10-27 16:10 t By hightman

...395'] 非常感谢...也在刚开始学习xunsearch xunsearch采用 scws 分词 xunsearch好像集成了 scws 对于分词 xunsearch 可以通过 XSTokenizer 扩展 我想问的是 既然是 集成scws 那么 1.有没有提供scws的api接口,实现短语分词功能 2.是否可以对scws...

287.scws-1.0.0 正式发布 (含php扩展及2文本词典)

更新时间:2010-01-29 13:01 t By hightman

...选] SCWS 是 Simple Chinese Words Segmentation 的缩写(简易中文分词系统)。 它是一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的 切分成词,因为词是汉语的基本语素单位,而书写的时候不像英语会在词之间 ...

288.scws与多线程

更新时间:2010-12-07 23:12 t By lauxinz

...在多线程环境下怎么使用libscws,每一个线程都需要进行分词? typedef struct { xdict_t d; rule_t r; unsigned char *mblen; unsigned int mode; unsigned char *txt; int zis; int len; int off; int wend; scws_res_t res0; scws_res_t res1; word_t **wmap; st...

289.RE: 英文可否实现这样的搜索

发布时间:2012-04-30 22:04 t By ykjsw

知道了,要自定义分词,用二元分词应该可以把。

290.RE: 不能搜索单个字

发布时间:2013-05-10 09:05 t By hightman

这不为什么,这就是全文检索,中文分词。搜索单字没有实际意义,实在有必要你可以自定义分词器,按字索引。

  • 时间不限
  • 按相关性排序