搜索

大约有 70 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1967秒)

31.添加新的分词无效

发布时间:2013-12-04 15:12 t By mengaifan

$cws = scws_new(); $cws->set_charset('utf8'); $cws->set_rule('D:/Program Files/scws/etc/rules.utf8.ini'); //注意路径 $cws->set_dict('D:/Program Files/scws/etc/dict.utf8.xdb'); $cws->add_dict(ROOT_PATH."inc/spider/dict_extra.txt", SCWS_XDICT_TXT);//新增词库 $cws->set_ignore(tru...

32.RE:1262

发布时间:2008-01-14 21:01 t By xueron

...ws; my $scws = Text::Scws->new; $scws->set_dict('dict.xdb'); $scws->set_rule('rule.ini'); $scws->set_ignore(1); $scws->set_multi(1); my $s = shift; $scws->send_text($s); while (my $r = $scws->get_result()) { foreach (@$r) { print $_->{word}, " "; } } print "\n"; [/code]...

33.自定义词库怎么控制(字母+数字)组合的个数

发布时间:2012-08-27 16:08 t By kill-all999

...$sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_set_rule($sh, './rules.ini');//文件内容为空 $cutword = $_POST['cutword']; scws_send_text($sh, $cutword); $rs = scws_get_tops($sh, 5); 另:我使用工具把默认的.xdb转化成.txt后在使用scws_get_tops()方法...

34.RE:1234

发布时间:2007-06-28 16:06 t By xiaoyong

...急 压缩包中包括以下部分: etc/ - gbk 版本词典和rules.ini libscws/ - scws 库核心代码 phpext/ - php4 扩展代码 (注意必须是 PHP4) src/ - scws 命令行工具 --- 给我发一份吧 邮件:[email]xiaoyong8000@163.com[/email]

35.RE:1262

发布时间:2008-01-14 21:01 t By xueron

1楼附件里面包含了libscws源码和gbk的dict.xdb和rules.ini,所以比较大

36.RE: 分词改进需求

发布时间:2009-11-16 15:11 t By hightman

将来可以考虑在rules.ini中增加这类设置..目前还不支持.

37.RE: 分词不对

更新时间:2010-04-28 15:04 t By xinbao

锅炉的用法上 No. WordString Attr Weight(times) ------------------------------------------------- 01. 法上 nz 14.14(1) 02. 锅炉 n 5.86(1) 分词也不对的[hr] 下载的rules.ini里没有v+v=10这个东西

38.RE: gbk规则集文件

发布时间:2012-07-23 14:07 t By hightman

pscws23 没有用到规则集,其词典与 scws 也不通用,代码已经弃用并且不维护了,建议不要用。 scws 中的 rules.ini 就是GBK的,

39.RE: 语句的BUG两例

发布时间:2013-04-23 09:04 t By hightman

第二句应该没有问题。 第一句你可以打印出属性后微调 rules.ini 中的 [attrs]来解决

40.RE: 遇到一个分词错误的问题

发布时间:2014-02-10 10:02 t By hightman

rule.utf8.ini里那些调节是通过常用词性组合来改变权重,这要求 词典的词性必须十分准确才行

  • 时间不限
  • 按相关性排序