搜索

大约有 359 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0050秒)

1.请问一下35G的数据生成索引大概得多长时间?

发布时间:2015-01-07 11:01 t By mlyykk

各位大侠,请问一下,mysql一个表有35G左右的数据,content内容很长。大概57W的数据。 用xunsearch建一次索引,大概需要多长时间?

2.可不可以介绍一下怎么把SCWS嵌入其他项目中?

发布时间:2007-06-20 17:06 t By bacchant

刚看到这个分词系统, 很感兴趣, 但是还不太会用, hightman能不能给个比较规范的步骤, 介绍一下怎样在c代码里调用scws的分词功能? 多谢

3.冒昧的问一下——怎么用tf和idf来计算权重?

发布时间:2011-12-21 18:12 t By hotpot

冒昧的问一下——怎么用tf和idf来计算权重啊?谢谢各位高手了~

4.RE: 请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-06-29 22:06 t By hightman

后者是什么意思,举例说明一下吧。SCWS处理英文是按普通单词和数字的规则来做

5.请问一下,怎么才能让词典里有的四字成语分割正确?

发布时间:2013-07-12 17:07 t By zhuaijay

我想请教一下,我用scws分割了一篇文章,里面把一些词典库里收录了的四字成语分割成一个字一个字的了,这是为什么?有没有什么设置方法能让它被正确地分割出来的?谢谢了~

6.能不能共享一下文本自动分类的程序

发布时间:2010-05-11 18:05 t By xiaolan

说不定可以提供我一点思路。。 也学习学习。 感谢。。

7.想咨询一下支持哪些语言

发布时间:2014-09-24 10:09 t By wiml

看官网说明,基本可以得知,支持简体中文 但其它支持哪些并没有明说,在特色与优势一页也未说明 我想知道对拉丁文和繁体中文支持吗?

8.请问一下自定义TXT词组怎么做啊?有这方面的说明资料吗?

发布时间:2011-05-04 12:05 t By myllop

请问一下自定义TXT词组怎么做啊?有这方面的说明资料吗? 不知道自定义成TXT的词组格式是什么样的。

9.RE: 刚翻译了一下这个倒java上

发布时间:2011-03-09 12:03 t By hightman

词性参与计算校正确实反而引发了不少错误,这一点正在考虑。

10.刚翻译了一下这个倒java上

更新时间:2011-02-22 10:02 t By mudie

...权重计算导致的问题挺多,这点是不是考虑规则权重调整一下? 2.可能是考虑性能问题,采取的局部寻优的办法也导致了一些问题,是不是考虑全局寻优,或者长一些范围内寻优?

  • 时间不限
  • 按相关性排序