搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

发布时间：2015-01-07 11:01 t By mlyykk

各位大侠，请问一下，mysql一个表有35G左右的数据，content内容很长。大概57W的数据。用xunsearch建一次索引，大概需要多长时间？

发布时间：2007-06-20 17:06 t By bacchant

刚看到这个分词系统, 很感兴趣, 但是还不太会用, hightman能不能给个比较规范的步骤, 介绍一下怎样在c代码里调用scws的分词功能? 多谢

发布时间：2011-12-21 18:12 t By hotpot

冒昧的问一下——怎么用tf和idf来计算权重啊？谢谢各位高手了~

发布时间：2013-06-29 22:06 t By hightman

后者是什么意思，举例说明一下吧。SCWS处理英文是按普通单词和数字的规则来做

发布时间：2013-07-12 17:07 t By zhuaijay

我想请教一下，我用scws分割了一篇文章，里面把一些词典库里收录了的四字成语分割成一个字一个字的了，这是为什么？有没有什么设置方法能让它被正确地分割出来的？谢谢了~

发布时间：2010-05-11 18:05 t By xiaolan

说不定可以提供我一点思路。。也学习学习。感谢。。

发布时间：2014-09-24 10:09 t By wiml

看官网说明，基本可以得知，支持简体中文但其它支持哪些并没有明说，在特色与优势一页也未说明我想知道对拉丁文和繁体中文支持吗？

发布时间：2011-05-04 12:05 t By myllop

请问一下自定义TXT词组怎么做啊？有这方面的说明资料吗？不知道自定义成TXT的词组格式是什么样的。

发布时间：2011-03-09 12:03 t By hightman

词性参与计算校正确实反而引发了不少错误，这一点正在考虑。

更新时间：2011-02-22 10:02 t By mudie

...权重计算导致的问题挺多，这点是不是考虑规则权重调整一下？ 2.可能是考虑性能问题，采取的局部寻优的办法也导致了一些问题，是不是考虑全局寻优，或者长一些范围内寻优？