搜索

大约有 49 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0983秒)

21.RE: 中文分组粗分方法

发布时间:2010-05-26 19:05 t By baobao

... ATTR 当机立断 14.01 8.10 i WORD ATTR我都能理解。 上贴说的逐字分词后 计算权重的时候使用IDF,貌似就是类似基于字典的最大概率方式来定义权重,或者说是对于歧义的取舍。 TF IDF 具体是指什么? 使用的概率计算公式能阐...

22.RE: 我想使用系统自动的分词功能,可是只看到有接口

发布时间:2011-11-24 23:11 t By hightman

不是很明白,你说的自动分词??是什么意思 你在配置文件中不要指定 tokenizer 选项就会自动使用 SCWS 分词了。

23.RE: SCWS 能否添加 “中文+英文”和“中文+数字”自定义词

发布时间:2012-08-30 12:08 t By hightman

支持是支持的,但数字字母最多只支持2位。 你说的情况其实切分成“斯巴鲁+WRX”并不会有多大问题吧。 像 Q币 QQ空间 这样的都是可以支持成词的。

24.RE: 为什么不提供历史版本的下载呢

发布时间:2011-09-17 01:09 t By hightman

每次更新都是期望改进,而不是倒退呵。 1.1.2 目前已经放入 [url]http://www.ftphp.com/scws/down/scws-1.1.2.tar.bz2[/url] 供下载。 您说的 1.1.2 在分词效果上比 1.1.8 还要好,可否指出哪几个实例 ?

25.RE: 求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 16:05 t By zouhc

感谢H大回复,好像是你说的这个问题。 曾经我以为这个scws是国外高人开发的,最近才发现国内的牛人。作为苦逼的程序一员,你就是我心中的刘德华了。

26.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

发布时间:2010-09-19 11:09 t By hightman

说的是哪个包解开是空的啊,是软件包还是词典,谢谢

27.RE: scws1.1.8为什么第一次都很慢。

发布时间:2011-10-24 11:10 t By hightman

我刚试了一下倒是很快啊。 你说的第一次慢是重启WEB后第一次还是隔一段时间分词就会这样?

28.RE: scws 词库与dict_user.txt文件有什么关系?

发布时间:2012-04-19 11:04 t By hightman

不明白你说的。同义词是基于分词后的结果制作的。 如果你的索引先前制作,后面再添加自定义词,那么当然无效了。你要重建索引

29.RE: xunsearch可以实现跨项目搜索吗?

更新时间:2013-04-08 15:04 t By xiwillo

...标题和内容,可否提示一下其他特殊的字段怎么办?可以说的再详细一点点吗?:blush: [hr] [quote='hightman' pid='3781' dateline='1365406402'] 搜索框整合,甚至可以字段合并啊。想办法区分类型 [/quote] 又比如论坛和团购这样子,论坛的...

30.RE: 迅搜报错

更新时间:2013-02-27 09:02 t By 277850318@qq.com

... dateline='1324274006'] 你的服务端连接有问题吧 先按我2楼说的办法设置了吗,此外更新到最新版先。 [/quote] [hr] 我也遇到这个问题 版本是最新的 超时也配置了 不过新新版本可以用重启解决 [quote='hightman' pid='462' dateline='1...

12345
  • 时间不限
  • 按相关性排序