搜索

大约有 60 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1000秒)

41.RE: [2012] SCWS-1.2.0 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2012-03-31 11:03 t By hightman

txt词库其实也是转换成XDB再调用的,不用担心性能。 你合并词典很简单啊,把 dict.utf8.xdb 导出来嘛

42.SCWS不支持英文和中英文混合分词吗?

更新时间:2010-08-24 20:08 t By fuhehe

我现在想要做屏蔽词,只载入自定义的屏蔽词库,但好像英文及中英文混合分词都无效。 譬如: $so = scws_new(); $so->set_charset('utf8'); $so->set_dict('words.txt',SCWS_XDICT_TXT); $so->set_ignore(true); $so->send_text("GMhello指导员"); echo ''; while ($tmp = $so...

43.RE: [2012] SCWS-1.2.0 发布,BSD协议、支持自定义词库、PHP5.4

发布时间:2012-04-01 14:04 t By gnhao

[quote='hightman' pid='8876' dateline='1333164684'] txt词库其实也是转换成XDB再调用的,不用担心性能。 你合并词典很简单啊,把 dict.utf8.xdb 导出来嘛 [/quote] 谢谢hm。还是更加期望加上直接入字典库的功能。这样更加方便,就是不知...

44.怎么回事呢 ?

发布时间:2011-08-08 14:08 t By assad

自定义词库加载不上,是什么原因呢? $cws = scws_new(); $cws->set_charset('utf8'); $cws->set_dict('/usr/local/scws/etc/dict.utf8.xdb'); $cws->set_dict(BASE_PATH.'admin/data/dict/wo.txt',SCWS_XDICT_TXT);

45.RE: ubuntu 64位无法分词

发布时间:2013-11-05 14:11 t By hightman

全是 /un 应该是词典不工作。这个词库应该是不依赖机器字节序的啊 TXT没有提供下载,但我们提供了PHP的脚本可以将XDB转换成TXT

46.添加新的分词无效

发布时间:2013-12-04 15:12 t By mengaifan

...s->add_dict(ROOT_PATH."inc/spider/dict_extra.txt", SCWS_XDICT_TXT);//新增词库 $cws->set_ignore(true); //var_dump($cws); //添加中文分词 $cws->send_text($a); dict_extra.txt 已经增加了一行:享鑫 1 1 n,但是“享鑫金属”还是只有金属被匹配出来

47.RE: ubuntu 64位无法分词

发布时间:2013-11-11 21:11 t By luopuya

...'5070' dateline='1383632500'] 全是 /un 应该是词典不工作。这个词库应该是不依赖机器字节序的啊 TXT没有提供下载,但我们提供了PHP的脚本可以将XDB转换成TXT [/quote]

48.RE: 请教:关于地市信息的分词结果,如何更准确?

发布时间:2010-09-26 20:09 t By hightman

由于词库太大干扰所致,建议可以附加一个小词典(目的是删除这些无用词汇,以下我写出来作参考,把下面的文字存成dict.txt,然后在原有的set_dict之后加上 scws_add_dict(s, 'path/to/this_ad_dict.txt', SCWS_XDICT_TXT); 这样使文本词典生效. ...

49.1.1.2的 自定义字典无法使用

更新时间:2010-05-23 01:05 t By 逆雪寒

...th') . '/rules.utf8.ini'); 结果分词无效果.好像是加载不到词库一样...试了很多次.都不行. 路径和权限我确定没有错误. 所以来求救了. hightman help me .谢谢你

50.RE: 10秒 10元 这样的想做为一个词要怎么配置

发布时间:2011-10-31 10:10 t By xjtdy888

[quote='hightman' pid='7103' dateline='1319824645'] 你要用自定义词库 编写一个 dict_extra.txt 里面写上每个词,一个一行 然后调用 add_dict 加入词典 [/quote] 您好,用自定义词库是可以解决但却不是太方便,如果SCWS不能这样的配置,...

  • 时间不限
  • 按相关性排序