感谢H大回复,好像是你说的这个问题。 曾经我以为这个scws是国外高人开发的,最近才发现国内的牛人。作为苦逼的程序一员,你就是我心中的刘德华了。
这大概是FREEBSD 8.X的一些不兼容造成的,安装完毕后没有连接动态库。 解决办法: cd /usr/local/scws/lib ln -s libscws.so.1.1.0 libscws.so
...很不方便啊,如果写个脚本调用你的[url=http://www.ftphp.com/scws/demo/get_tfidf.php]在线TF/IDF算法工具[/url],恐怕上万条请求你的服务器招架不住啊。。。 老大你的词库更新的好慢啊,2010年十二月距离现在都一年了,何况互联网上每...
...小白~ 想问下 我用迅搜 如何设定一些词 使得这些词不被scws进行分词 比如 “米兔车贴” 这个词, 被分词成 “米兔车 贴” 我该如何操作,才能使得这个词不被分开 我看到有用户自定义词典 dict_user.txt 我在里面写了: 米...
...做确实是可以,只是这时候文件就只是一个联系数据库和scws的一个中介,一个很临时的东西。我的意思是想可不可以绕过它。
如果只要文章中有Linux出现就算是Linux相关文章的话,其实是不需要分词了,直接用全文搜索Linux就好了。 只是SCWS目前看前来它的自定义词典不支持超过3个字,如果可以的话,可以通过自定义“Linux优化”来指定分词
目前没有方法,我看只有采集 http://www.ftphp.com/scws/demo/get_tfidf.php 这个地址。 希望可以共享一下
还是不明白! 你把这段文字用scws切割会有问题吗?如果你这段字是用空格或逗号分隔,那么你可以用 split 这个分词器啊。 搜索的时候搜索任何一个分割后的TAG都可以搜索到。
...http://www.hightman.cn/bbs/images/common/back.gif[/img][/url] 按照 GPL2,scws 应该GPL2发布的, 另外,感觉你对jabberd2的代码很熟悉啊,不过从软件架构,模块划分,jabberd2都相当不错 [/quote] 呵,我认为我只是学习了它的代码。至于GPL以前我...