搜索

大约有 810 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0060秒)

741.RE: 求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 16:05 t By zouhc

感谢H大回复,好像是你说的这个问题。 曾经我以为这个scws是国外高人开发的,最近才发现国内的牛人。作为苦逼的程序一员,你就是我心中的刘德华了。

742.RE: freebsd8.2里安装php的扩展出现错误

发布时间:2011-10-23 23:10 t By hightman

这大概是FREEBSD 8.X的一些不兼容造成的,安装完毕后没有连接动态库。 解决办法: cd /usr/local/scws/lib ln -s libscws.so.1.1.0 libscws.so

743.求TF/IDF算法。

发布时间:2011-12-24 16:12 t By emo

...很不方便啊,如果写个脚本调用你的[url=http://www.ftphp.com/scws/demo/get_tfidf.php]在线TF/IDF算法工具[/url],恐怕上万条请求你的服务器招架不住啊。。。 老大你的词库更新的好慢啊,2010年十二月距离现在都一年了,何况互联网上每...

744.想手动指定一些不进行分词的词语

发布时间:2013-07-23 16:07 t By seagg

...小白~ 想问下 我用迅搜 如何设定一些词 使得这些词不被scws进行分词 比如 “米兔车贴” 这个词, 被分词成 “米兔车 贴” 我该如何操作,才能使得这个词不被分开 我看到有用户自定义词典 dict_user.txt 我在里面写了: 米...

745.RE: 有没有添加单个或多个词的函数?

发布时间:2010-07-29 15:07 t By backluck

...做确实是可以,只是这时候文件就只是一个联系数据库和scws的一个中介,一个很临时的东西。我的意思是想可不可以绕过它。

746.三个问题需要求教

发布时间:2011-01-17 11:01 t By nftw

...家電節能”,会分为 “家+電+節+能”。 总之 scws用着很顺手,感谢hightman.

747.RE: 这个不支持英文词典和中英文混合词典啊

发布时间:2012-02-22 19:02 t By vanni

如果只要文章中有Linux出现就算是Linux相关文章的话,其实是不需要分词了,直接用全文搜索Linux就好了。 只是SCWS目前看前来它的自定义词典不支持超过3个字,如果可以的话,可以通过自定义“Linux优化”来指定分词

748.RE: 冒昧的问一下——怎么用tf和idf来计算权重?

发布时间:2012-05-21 16:05 t By markmx

目前没有方法,我看只有采集 http://www.ftphp.com/scws/demo/get_tfidf.php 这个地址。 希望可以共享一下

749.RE: 我想使用系统自动的分词功能,可是只看到有接口

发布时间:2011-11-25 12:11 t By hightman

还是不明白! 你把这段文字用scws切割会有问题吗?如果你这段字是用空格或逗号分隔,那么你可以用 split 这个分词器啊。 搜索的时候搜索任何一个分割后的TAG都可以搜索到。

750.RE:1240

发布时间:2007-06-22 12:06 t By hightman

...http://www.hightman.cn/bbs/images/common/back.gif[/img][/url] 按照 GPL2,scws 应该GPL2发布的, 另外,感觉你对jabberd2的代码很熟悉啊,不过从软件架构,模块划分,jabberd2都相当不错 [/quote] 呵,我认为我只是学习了它的代码。至于GPL以前我...

  • 时间不限
  • 按相关性排序