搜索

大约有 10 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0303秒)

1.RE: 三个问题需要求教

发布时间:2011-01-18 21:01 t By hightman

只要 SCWS_MULTI_DUALITY 即可了。 SHORT 是指把“中国”再细切为“中国”+“” ZMAIN 是把其中的主要文字都切出来,比如“中国”在其它切法的基础上再切出“中”+“国”+“” ZALL 则所有文字,ZMAIN只会切出包含在词典中...

2.set_multi()复合分词问题

发布时间:2012-10-23 10:10 t By muzi1012

想请教下,假如我开启复合分词,在返回的分词结果里怎么区分哪些是复合分词的结果,哪些是平常的结果? 比如我对“中国”分词,返回中国++中国,怎么单独提取复合词 中国+呢?

3.仍然是第一个例子的问题,怎么连“中国”都没分出来?

发布时间:2013-04-14 15:04 t By zctr

例子: 我已经将文件存为ANSI形式了,编码的问题解决了。 可是,我发现分词不了。请看结果: Array ( [0] => Array ( [word] => 我 [off] => 0 [len] => 2 [idf] => 0 [attr] => un ...

4.仍然是第一个例子的问题,怎么连“中国”都没分出来?

发布时间:2013-04-14 15:04 t By zctr

例子: 我已经将文件存为ANSI形式了,编码的问题解决了。 可是,我发现分词不了。请看结果: Array ( [0] => Array ( [word] => 我 [off] => 0 [len] => 2 [idf] => 0 [attr] => un ...

5.scws_set_multi()函数的一个小问题....

发布时间:2010-12-06 22:12 t By lauxinz

...:设定分词执行时是否执行针对长词复合切分。(例如:中国->中国++中国)。参数 mode 表示复合分词法的级别,取值为 1 ~ 15。mode 设定值,1~15。[b]按位与[/b]的 1|2|4|8 依次表示 短词|二元|主要单字|全部单字。缺省不复合...

6.新手請教一个安装成功后的問題

发布时间:2014-02-10 10:02 t By niutou

我下了中文分詞系统1.2.2 在linux环境下安装成功了,但是分词时,会被分成一个一个的汗字 比如:我是一个中国 分词后就变成了:我 是 一 个 中 国

7.使用自定义词库的时候,部分词会丢失

更新时间:2014-04-18 17:04 t By tianly

...去掉标点符号 $so->set_ignore(false); //是否复式分割,如“中国”返回“中国中国”三个词。 $so->set_multi(false); //设定将文字自动以二字分词法聚合 $so->set_duality(true); //要进行分词的语句 $so->send_text("朝鲜近日播放的...

8.请教为什么我这个无法分割成功啊?

发布时间:2011-07-05 20:07 t By cool

...ni 中指定路径下的词典和规则文件 $so->send_text("我是一个中国");; while ($tmp = $so->get_result()) { foreach($tmp as $k=>$v){ echo $v['word']."|"; } print_r($tmp); } $so->close(); 我用的版本是:php_scws.dll(2) PHP扩展库 Windows/PHP 5.2.x 准确: 95%, 召...

9.Libscws C API 使用说明

更新时间:2010-12-30 22:12 t By hightman

.../b]设定分词执行时是否执行针对长词复合切分。(例如:中国->中国++中国)。 参数 mode 表示复合分词法的级别,取值由下面几个常量异或组合: SCWS_MULTI_SHORT | SCWS_MULTI_DUALITY | SCWS_MULTI_ZMAIN | SCWS_MULTI_ZALL 依次表示 短词|二...

10.SCWS-php扩展的说明及用法

发布时间:2007-06-07 18:06 t By hightman

...s)[/color] 说明:设定分词返回结果时是否复式分割,如“中国”返回“中国中国”三个词。 返回:始终为 true 参数:scws_handle 即之前由 scws_open 打开返回的; yes 设定值,如果为 true 则结果中执行复式分割,...

  • 时间不限
  • 按相关性排序