搜索

大约有 48 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0123秒)

21.RE: 如何去除无用的词?

发布时间:2013-05-02 12:05 t By darena

我用UTF8, 也是"我是中国人", 出来的正好只有"中国人"一个词

22.RE: XSTokenizerScws的一个使用问题

发布时间:2013-01-30 14:01 t By hightman

...词。 复合分词是对原本是词的长词情况处理的,比如”中国“可以切成”中“+”国“+”中国“ 你的问题必须是 [code] $tk = $tokenizer->setDuality(false)->setIgnore(true)->setMulti(11)->getResult("是一"); [/code]

23.RE: XSTokenizerScws的一个使用问题

发布时间:2013-02-02 13:02 t By tisswb

...词。 复合分词是对原本是词的长词情况处理的,比如”中国“可以切成”中“+”国“+”中国“ 你的问题必须是 [code] $tk = $tokenizer->setDuality(false)->setIgnore(true)->setMulti(11)->getResult("是一"); [/code] [/quote] 感谢指教,好好...

24.scws_set_multi()函数的一个小问题....

发布时间:2010-12-06 22:12 t By lauxinz

...:设定分词执行时是否执行针对长词复合切分。(例如:中国人->中国+人+中国人)。参数 mode 表示复合分词法的级别,取值为 1 ~ 15。mode 设定值,1~15。[b]按位与[/b]的 1|2|4|8 依次表示 短词|二元|主要单字|全部单字。缺省不复合...

25.RE:1262

发布时间:2008-01-14 21:01 t By xueron

...print "\n"; [/code] [code] $perl test.pl 核心提示:14日下午,中国总理温家宝与来访的印度总理辛格在人民大会堂举行会谈。温家宝表示,愿意与辛格就新形势下进一步发展中印?战略合作关系交换意见。 核心 提示 日 下午 中国 总...

26.使用自定义词库的时候,部分词会丢失

更新时间:2014-04-18 17:04 t By tianly

...去掉标点符号 $so->set_ignore(false); //是否复式分割,如“中国人”返回“中国+人+中国人”三个词。 $so->set_multi(false); //设定将文字自动以二字分词法聚合 $so->set_duality(true); //要进行分词的语句 $so->send_text("朝鲜近日播放的...

27.fedroa 上编译安装 scws 之后出现分词不准确

更新时间:2010-11-30 00:11 t By smartly

...Windows php5 下运行正常 纠结问题所在 原话:“喜讯:谷歌中国宣布将关闭两大服务 终止与天涯合作” 分词结果:“谷歌中 宣布 关闭两” Windows 下分词就是正确的 分词结果:“喜讯 谷歌 中国 宣布 将 关闭 两 大 服务 终止 与 ...

28.我对切词尝试做了下功能修改

更新时间:2013-12-27 20:12 t By linqingtao

...分处理的是开头有数字或字母的情况 // 如 “ABC中国足球" 之类的结果 // 对于上面的词 如果词库中有 “ABC中国足球” “中国足球” // 旧代码切词结果是“ABC” “中国足球" // 修改后的切词结果是 "A...

29.删除貌似存在bug

发布时间:2013-05-02 11:05 t By luxp4588

首先感谢highman的系统,我的网站是www.71114.com(中国企业114黄页),主要使用这套系统检索供求信息。最近发现一个问题,无论是用主键删除还是索引词删除,都无法删掉。不知道是哪里存在问题,还请highman指点一下

30.请教一个新手问题

发布时间:2014-02-19 00:02 t By limw

中国国民党荣誉主席连战及随访 结果分词就把“连战及”分到一起了。 请问有解决办法嘛? 似乎两个字的名字,容易和后面的字分到一起。 我在论坛中看到了“武松杀”的帖子,但是貌似没有解决办法? 谢谢。

12345
  • 时间不限
  • 按相关性排序