搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

11.RE: 关键词包含多个词时,如何让结果按相关度排序?

发布时间：2011-12-13 13:12 t By hightman

基本上会保证在相对前面，但内部用BM25计算的，如果有些文章包含的词次数更多可能会在前面吧。最好给出例子和实际页面。

12.RE: 实时加载字典，服务器严重吃不消，有没有办法？

发布时间：2009-07-15 23:07 t By hightman

[quote='askie' pid='3233' dateline='1247660523'] 如果分词次数太多，很容易引起服务器假死，linux服务器！请问老大有没有加载到内容进行调用的方法？ [/quote] 当然有啊,你看一下说明吧. 我不清楚你用的是什么方式,是PHP还是c的API, set...

13.RE: 实时加载字典，服务器严重吃不消，有没有办法？

发布时间：2009-08-03 23:08 t By askie

...247673062'] [quote='askie' pid='3233' dateline='1247660523'] 如果分词次数太多，很容易引起服务器假死，linux服务器！请问老大有没有加载到内容进行调用的方法？ [/quote] 当然有啊,你看一下说明吧. 我不清楚你用的是什么方式,是PHP还...

... {return} array 返回词汇数组, 每个词汇是包含 [times:次数,attr:词性,word:词] 源码: sdk/php/lib/XSTokenizer.class.php#L361 (显示) public function getTops($text, $limit = 10, $xattr = ''){ $words = array(); $text = $this->applySetting($text); $cmd = new XSC...

15.RE: 实时加载字典，服务器严重吃不消，有没有办法？

发布时间：2009-08-06 00:08 t By hightman

...247673062'] [quote='askie' pid='3233' dateline='1247660523'] 如果分词次数太多，很容易引起服务器假死，linux服务器！请问老大有没有加载到内容进行调用的方法？ [/quote] 当然有啊,你看一下说明吧. 我不清楚你用的是什么方式,是PHP还...

16.关于 misc/ 目录下的文件

发布时间：2007-06-06 10:06 t By hightman

...的始终, 故目前 socket 设为无阻塞模式尝试读取一定次数后仍没数据就假设已经读完, 在 close() 前调用 recv() 会比较浪费资源. 这一点请注意, 务必一个 send() 对应一次 recv() PHP 版本要求 >= 4.3.0 类用法: 建立操作...

17.在 Xunsearch 使用 SCWS

...只是把 *off* 替换为 *times* 表示这个词在文本中出现的总次数。 ~~~ [php] $text = '迅搜(xunsearch)是优秀的开源全文检索解决方案'; // 提取前 5 个重要词，要求词性必须是 n 或v 或 vn $tops = $tokenizer->getTops($text, 5, 'n,v,vn'); print_r($tops); ~~~...

18.C版简易中文分词-cscwsd-0.0.3 发布

发布时间：2007-06-06 10:06 t By hightman

...出而等到最后一句再输出结果, 排好顺序?? 格式：词语\t次数\r\n /set stat=off (停止统计) 4. 编译选项 --enable-mio=[select|poll] 缺省是 poll --enable-mio-debug 打开 mio 的 debug 信息 --enalbe-debug 打开主体程序的 debug 信息

19.XSTokenizerScws

... {return} array 返回词汇数组, 每个词汇是包含 [times:次数,attr:词性,word:词] 源码: sdk/php/lib/XSTokenizer.class.php#L361 (显示) public function getTops($text, $limit = 10, $xattr = ''){ $words = array(); $text = $this->applySetting($text); $cmd = new XSC...

20.Libscws C API 使用说明

更新时间：2010-12-30 22:12 t By hightman

...返回指定的关键词表统计集，系统会自动根据词语出现的次数及其 idf 值计算排名。参数 limit 指定取回数据的最大条数，若传入值为0或负数，则自动重设为10。参数 xattr 用来描述要排除或参与的统计词汇词性，多个词性之间用...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

搜索