搜索

大约有 130 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1932秒)

111.2007简易分词第4版(scws-0.1.x)体验

发布时间:2007-06-06 11:06 t By hightman

.../url](推荐) [url=http://www.hightman.cn/demo/scws/v48.php]UTF-8版[/url](词库较旧) 目前全部使用 *Unix* 系统下的标准C开发,全部采用自行设计的词典格式 (XTree 和 XDB) 完全不需要依赖任何第三方库及数据库系统。统一编译成链接库 (.a或.so...

112.[bogus] 大bug,add_dict会覆盖原来默认设置的dict,必须显式设置原dict

更新时间:2011-06-10 13:06 t By itlong

...->send_text($str); $sk = $so->get_result(); 这样,会得不到增加词库的效果, 必须: $so = scws_new(); $so->add_dict(LIB_DIR.'/scws/ext/dict.utf8.xdb');[b]//这里阿。。[/b] $so->add_dict(LIB_DIR.'/scws/phptool/dels.txt', SCWS_XDICT_TXT); $so->send_text($str); $sk = $so...

113.RE: 英文数字组合字符串分词问题

发布时间:2014-05-14 11:05 t By soarb

[quote='hpxl' pid='7811' dateline='1400033006'] sdk/php/app/demo.ini配置 [id] type = id [/quote] 是scws-1.2.2 的如何让它支持自已定义的英文词库? 像http://bbs.xunsearch.com/showthread.php?tid=3088 这样修改代码吗?

114.libscws的问题

发布时间:2009-12-02 16:12 t By nftw

... (IDF = 0.00) length: 2 Word: 程序员/nr (IDF = 3.50) length: 6 但词库中是存在“中国”这个词的,是不是我程序中哪里设置的不对呢? 还有就是,在对默认提供的 "Hello, 我名字叫李那曲是一个中国人, 我有时买Q币来玩, 我还听说过C#...

115.RE: 请教:关于地市信息的分词结果,如何更准确?

发布时间:2010-09-26 20:09 t By hightman

由于词库太大干扰所致,建议可以附加一个小词典(目的是删除这些无用词汇,以下我写出来作参考,把下面的文字存成dict.txt,然后在原有的set_dict之后加上 scws_add_dict(s, 'path/to/this_ad_dict.txt', SCWS_XDICT_TXT); 这样使文本词典生效. ...

116.RE: 第四版遇到()和中英文混合分詞的問題。

更新时间:2009-06-16 00:06 t By JamesKG

...ch ($words as $word) { print_r($word); } } 此外, 繁体词库很不完善, 缺词太多而且有一些词也不正确 [/quote] 非常謝謝版主的指導,我的問題已經解決了。 這個程式非常好用,[color=#FF0000]日後希望能夠看到更齊全的繁體...

117.RE: 官方和提供的下载不一样,并且官方实例还写了错误代码

更新时间:2010-07-14 21:07 t By sulwan

...会出错呢? 我直接在代码中修改那里呢? 上边指定的词库也是UTF8啊 您能否提供完整实例下载呢,直接查看您源码就是乱码,我要右键选择编码,完后复制的![hr] extension = scws.so scws.default.charset = utf8 scws.default.fpath = /usr/loc...

118.RE: 1.1.2的 自定义字典无法使用

更新时间:2010-05-23 22:05 t By 逆雪寒

... $so->set_ignore(0); $so->set_multi(0); 就是不行. 我也怀疑是词库加不上的问题.这个问题太奇怪了. 不显式 set_dict 或 add_dict 那就很正常.[hr] 再次确定了下,显式加载字典后.总有点异常情况. http://116.252.185.149/fs360/web.php?words=%E9%82%...

119.RE: 有没有添加单个或多个词的函数?

发布时间:2010-07-29 15:07 t By backluck

...dateline='1280386250'] 其实你可以定时或某种其它方案把你的词库统一生成.XDB文件呀 [/quote] 这样做确实是可以,只是这时候文件就只是一个联系数据库和scws的一个中介,一个很临时的东西。我的意思是想可不可以绕过它。

120.RE: 有没有添加单个或多个词的函数?

发布时间:2010-08-02 11:08 t By backluck

...的函数? [/quote] 现在没有这个需求了,因为我的非法词库里面有英文的词语

  • 时间不限
  • 按相关性排序