搜索

大约有 40 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0051秒)

1.RE: 中文分组粗分方法

发布时间:2010-05-27 11:05 t By hightman

TF就是词频率,就是这个词在各种语料中出现的机率权重。(越经常出现的越高) IDF是逆词频率,就是说这个词更重要(因为罕见一些);具体参见:http://baike.baidu.com/view/1228847.html 并没有很固定的算法,SCWS中的tf/idf均...

2.RE: Facets功能会加吗?

发布时间:2011-10-22 09:10 t By ixulf

...现在我有一个这样的需求,按日期的降序,时间的升序,就是当天最早发布的信息在前。一个字段排序构造不出这样排序的值,但是这个需求我觉得一点也不过分。 还有对带一个数字类型的字段的多字段复合排序,现在的API...

3.RE: 一个现象

发布时间:2011-10-28 13:10 t By hightman

启动时会检测相关的PID文件,如果PID指向的进程存在它会以为是进程是活的。 大概是发生了小机率事件,就是你的PID虽然存在但并不是INDEXD的了。。。所以出现这样的情况,但问题不大,是小概率事件。呵

4.您好,请教一个问题

发布时间:2011-12-25 01:12 t By assad

我一直在关注您开发的分词,已经在很多项目中使用 突然发现您公布了开源搜索方案,很是惊讶,很感谢您的辛勤付出。 我想请教几个问题: 1.是否支持增量索引自动化。就是自动把新数据加入索引。 2.是否支持join查询

5.RE: 安装后,第一个例子,显示乱码

发布时间:2013-03-28 10:03 t By hightman

明显,你的源码是以UTF-8存的,就是你的中文其实是UTF-8的

6.RE: 关于数词、量词

发布时间:2013-12-06 10:12 t By hightman

这个应该没办法,所有的调整都是基于词典,就是词典的优先级最最高了。 可以用程序扫出类似的词来删除它们,因为互联网语料库这些自动都列到词里了。

7.RE: addRange后count不准确

更新时间:2014-10-07 22:10 t By xilin

...scws,利用lib/xs.php的内容,作了修改,得出的值明显是准确的.就是xapian本身可以得出相对正常的结果,但是使用xunsearch后,在多重排序后,结果不正确

8.RE: libscws的问题

发布时间:2009-12-04 10:12 t By hightman

从结果看应该是 scws_set_dict(s, "/usr/local/etc/dict_chs_gbk.xdb", SCWS_XDICT_MEM); 这句话出了问题, 就是可能词典不正确. 但这个词典目前测试在64位系统下也是可以正常工作的, 检查一下词典的字节数是不是没有下载完整.

9.RE: addRange后count不准确

发布时间:2014-10-31 18:10 t By akstrom

...scws,利用lib/xs.php的内容,作了修改,得出的值明显是准确的.就是xapian本身可以得出相对正常的结果,但是使用xunsearch后,在多重排序后,结果不正确 [/quote] 是阿,这个问题很验证,能否不用估算这个?因为毕竟还没到百度那个等...

10.RE: 如何设置“自定义词典”的路径?

发布时间:2010-10-28 15:10 t By hightman

你在include/里放的 php 是直接运行的吗?就是起始目录位置了? 你可以统一只放一个词典位于上层的 etc/ 然后用绝对路径访问词典或在同不的目录用不同的相对路径啊, 像第一个情况是 ../etc/ 第二个应该是 ../../etc

1234
  • 时间不限
  • 按相关性排序