搜索

大约有 6 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1015秒)

1.RE: 怎么让匹配到得关键靠前的权重高一些?

发布时间:2012-04-19 15:04 t By loveloop

...都是完全匹配,则出现在结果的列的最前面的给予最高权重。 如果有多个结果同时完全匹配,且同时出现在最首位,则结果列最短的给予较高权重。 目前测试结果还算满意

2.RE: 中文分组粗分方法

发布时间:2010-05-27 11:05 t By hightman

TF就是频率,也就是这个在各种语料中出现的机率权重。(越经常出现的越高) IDF是逆频率,也就是说这个更重要(因为罕见一些);具体参见:http://baike.baidu.com/view/1228847.html 并没有很固定的算法,SCWS中的tf/idf均...

3.RE: small50,big161这种汇搜索不到

发布时间:2013-06-18 11:06 t By hightman

...下,这是因为你既是自定义分器又指定了 non_bool 参与权重计算。 那么 SDK 端先按自定义分器拆分重新组合成查询语句,发送到 xapian 解析器时由于不是 boolean prefix,因此它又会调用内部切法再次切割。 简单解决可以将这...

4.RE: 搜索整个数据库时, 排序结果错误

发布时间:2012-09-13 13:09 t By hightman

不明白你说的具体什么意思。 addWeight 的权重可以是小数,注意微调。这个加的不是字段而是针对包含指定索引的文档提权。  

5.RE: 中文分组粗分方法

发布时间:2010-05-26 14:05 t By hightman

...后把有岐义的部分拧出来,以其中一个为主体进行计算权重,看哪个情况最优。 此外还有根据rules规则匹配。 简单举个例子: “开放下载” 1. 开/放下/载 2. 开放/下载 根据典中的tdf进行一个运算得出概率而采取最高...

6.在做一个PHP的项目。 部分功能用到scws。 大家多多交流

更新时间:2010-05-11 18:05 t By xiaolan

...的时候就对它进行分,对其中的关键进行分析,取出权重以及出现频率比较高的, 作为这条信息的一个最高检索依据,然后在用户搜索的时候 对再对用户输入的关键字/进行分析, 然后用关键字分的结果到数据库进行...

  • 时间不限
  • 按相关性排序