搜索

大约有 11 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1957秒)

1.set_multi()复合分词问题

发布时间:2012-10-23 10:10 t By muzi1012

想请教下,假如我开启复合分词,在返回的分词结果里怎么区分哪些是复合分词的结果,哪些是平常的结果? 比如我对“中国人”分词,返回中国+人+中国人,怎么单独提取复合词 中国+人呢?

2.RE: 分词问题

更新时间:2010-10-14 21:10 t By hightman

这里需要用到 set_multi,不过鉴于该词先单字后多字,所以达不到“云“+”计算“的效果。 使用 txt 附加词典时请显式地先指定 xdb 词典,以便 txt 词典后生效。 $so->add_dict('dict.xdb', SCWS_XDICT_XDB); $so->add_dict('dict.txt', SCWS_XDICT_TXT); [c...

3.RE: 关于词典和分词

发布时间:2011-03-22 20:03 t By zfzeng

[quote='leeeboo' pid='4129' dateline='1300776583'] set_mutli() php扩展里是否有这个方法 Fatal error: Call to undefined method SimpleCWS::set_mutli() [/quote] 应该是set_multi(0)

4.RE:1262

发布时间:2008-01-14 21:01 t By xueron

...('dict.xdb'); $scws->set_rule('rule.ini'); $scws->set_ignore(1); $scws->set_multi(1); my $s = shift; $scws->send_text($s); while (my $r = $scws->get_result()) { foreach (@$r) { print $_->{word}, " "; } } print "\n"; [/code] [code] $perl test.pl 核心提示:14日下...

5.关于扩展词库的问题

发布时间:2012-12-10 15:12 t By timeage

... $cws->set_duality(true); $cws->set_ignore(true); $cws->set_multi(1 | 2 | 4 | 8); $cws->send_text($mydata); $cws->get_result();

6.RE: 1.1.2的 自定义字典无法使用

更新时间:2010-05-23 22:05 t By 逆雪寒

...'/rules.utf8.ini'); // $so->set_duality(0); $so->set_ignore(0); $so->set_multi(0); 就是不行. 我也怀疑是词库加不上的问题.这个问题太奇怪了. 不显式 set_dict 或 add_dict 那就很正常.[hr] 再次确定了下,显式加载字典后.总有点异常情况. htt...

7.使用自定义词库的时候,部分词会丢失

更新时间:2014-04-18 17:04 t By tianly

...如“中国人”返回“中国+人+中国人”三个词。 $so->set_multi(false); //设定将文字自动以二字分词法聚合 $so->set_duality(true); //要进行分词的语句 $so->send_text("朝鲜近日播放的一个纪录片中,发现"); //获取分词结果,如果提取...

8.RE: 1.1.2的 自定义字典无法使用

更新时间:2010-05-24 22:05 t By 逆雪寒

...d); var_dump($rr); // $so->set_duality(0); $so->set_ignore(1); $so->set_multi(0); $words = $_GET['words']; //分词 $so->send_text($words); echo($words); //打印搜索的关键字 var_dump($so->get_result()); $so->close(); 异常下返回的结果 bool(true) bool(true) 笔...

9.求助:演示的源码在本地和演示上分词测试结果不同【已解决】

更新时间:2013-07-02 21:07 t By jjyang

...arset('utf8'); $cws->set_duality(false); $cws->set_ignore(false); $cws->set_multi(0); $limit=10; $xattr = '~v';[/code] [size=x-large][u][b]求解,不胜感激!![/b][/u][/size][hr] 好奇怪,我分出来的都是nr,我本地用的是demo的源码,没有设置这个~ [b][colo...

10.RE: 怎样才能 字母数字汉字组合 按照词典分成一个词语呢?

更新时间:2013-07-03 16:07 t By shuyinglee

...ULE; + + if (yes == SCWS_NA) + s->mode &= ~SCWS_USE_RULE; +} + void scws_set_multi(scws_t s, int mode) { s->mode &= ~SCWS_MULTI_MASK; @@ -1135,6 +1148,11 @@ ch = txt[off]; if (ch mode & SCWS_USE_RULE)) + { + if (!(pflag & PFLAG_WITH_MB)) { // pure single-byte -> multibyte (2b...

12
  • 时间不限
  • 按相关性排序