搜索

大约有 21 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0069秒)

11.RE: 关键词包含多个词时,如何让结果按相关度排序?

发布时间:2011-12-13 13:12 t By hightman

基本上会保证在相对前面,但内部用BM25计算的,如果有些文章包含的词次数更多可能会在前面吧。 最好给出例子和实际页面。

12.RE: 实时加载字典,服务器严重吃不消,有没有办法?

发布时间:2009-07-15 23:07 t By hightman

[quote='askie' pid='3233' dateline='1247660523'] 如果分词次数太多,很容易引起服务器假死,linux服务器! 请问老大有没有加载到内容进行调用的方法? [/quote] 当然有啊,你看一下说明吧. 我不清楚你用的是什么方式,是PHP还是c的API, set...

13.RE: 实时加载字典,服务器严重吃不消,有没有办法?

发布时间:2009-08-03 23:08 t By askie

...247673062'] [quote='askie' pid='3233' dateline='1247660523'] 如果分词次数太多,很容易引起服务器假死,linux服务器! 请问老大有没有加载到内容进行调用的方法? [/quote] 当然有啊,你看一下说明吧. 我不清楚你用的是什么方式,是PHP还...

14.XSTokenizerScws::getTops

... {return} array 返回词汇数组, 每个词汇是包含 [times:次数,attr:词性,word:词] 源码: sdk/php/lib/XSTokenizer.class.php#L361 (显示) public function getTops($text, $limit = 10, $xattr = ''){ $words = array(); $text = $this->applySetting($text); $cmd = new XSC...

15.RE: 实时加载字典,服务器严重吃不消,有没有办法?

发布时间:2009-08-06 00:08 t By hightman

...247673062'] [quote='askie' pid='3233' dateline='1247660523'] 如果分词次数太多,很容易引起服务器假死,linux服务器! 请问老大有没有加载到内容进行调用的方法? [/quote] 当然有啊,你看一下说明吧. 我不清楚你用的是什么方式,是PHP还...

16.关于 misc/ 目录下的文件

发布时间:2007-06-06 10:06 t By hightman

...的始终, 故目前 socket 设为无阻塞模式 尝试读取一定次数后仍没数据就假设已经读完, 在 close() 前调用 recv() 会比较浪费资源. 这一点请注意, 务必一个 send() 对应一次 recv() PHP 版本要求 >= 4.3.0 类用法: 建立操作...

17.在 Xunsearch 使用 SCWS

...只是把 *off* 替换为 *times* 表示这个词在文本中出现的总次数。 ~~~ [php] $text = '迅搜(xunsearch)是优秀的开源全文检索解决方案'; // 提取前 5 个重要词,要求词性必须是 n 或v 或 vn $tops = $tokenizer->getTops($text, 5, 'n,v,vn'); print_r($tops); ~~~...

18.C版简易中文分词-cscwsd-0.0.3 发布

发布时间:2007-06-06 10:06 t By hightman

...出而等到最后一句再输出结果, 排好顺序?? 格式:词语\t次数\r\n /set stat=off (停止统计) 4. 编译选项 --enable-mio=[select|poll] 缺省是 poll --enable-mio-debug 打开 mio 的 debug 信息 --enalbe-debug 打开主体程序的 debug 信息

19.XSTokenizerScws

... {return} array 返回词汇数组, 每个词汇是包含 [times:次数,attr:词性,word:词] 源码: sdk/php/lib/XSTokenizer.class.php#L361 (显示) public function getTops($text, $limit = 10, $xattr = ''){ $words = array(); $text = $this->applySetting($text); $cmd = new XSC...

20.Libscws C API 使用说明

更新时间:2010-12-30 22:12 t By hightman

...返回指定的关键词表统计集,系统会自动根据词语出现的次数及其 idf 值计算排名。参数 limit 指定取回数据的最大条数,若传入值为0或负数,则自动重设为10。参数 xattr 用来描述要排除或参与的统计词汇词性,多个词性之间用...

123
  • 时间不限
  • 按相关性排序