搜索

大约有 69 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0050秒)

21.关于addWeight()使用的一些注意(分享&讨论)

更新时间:2011-12-13 13:12 t By KnightE

需求是,我需要对一些内容的分类,采取不同权重设置,而对于一些无分类的内容使用较低权重(不能直接过滤,我希望没分类的内容能搜索到,只是希望排序靠后)。 demo中的案例使用没有问题,在实际开发中,发现没有起作...

22.RE: 分词不对

更新时间:2010-04-30 13:04 t By hightman

呃确实存在,这都跟这个词库有关系,是互联网上整理的词库,像“法上”居然是专有名词而且权重很高。。。 可以考虑删除“法上”这个错误的词,外挂一个文本词典把“法上”标记为删除或设成更低权重及词性

23.RE: 搜索整个数据库时, 排序结果错误

发布时间:2012-11-09 16:11 t By stars_and_moon

我修改了里面权重计算方式, 可能默认的权重计算比较复杂吧

24.RE:1268

发布时间:2008-04-08 13:04 t By ianlow

可以添加对词性的判断,以及词性的权重比,应该可以达到你想要的效果~ 例如:在SCWS分析以上三句词性得到: 你/r 给/v 我/r 买/v 的/uj 衣服/n 你/r 看/v 的/uj 书/n 一/m 件/q 衣服/n 以此可以看出,其中匹配的是 你/r 的/uj 衣服/n ...

25.RE: 中文分组粗分方法

发布时间:2010-05-26 19:05 t By baobao

...8.10 i WORD ATTR我都能理解。 上贴说的逐字分词后 计算权重的时候使用IDF,貌似就是类似基于字典的最大概率方式来定义权重,或者说是对于歧义的取舍。 TF IDF 具体是指什么? 使用的概率计算公式能阐述下么? 谢谢。

26.RE: 结合搜索引擎来制作自动标签系统

发布时间:2011-12-08 08:12 t By Dull

...词 -> 搜索匹配 -> 前10个结果取样(比如取共有的标签 按照权重分配标签权重) -> 输出 这些元素xunsearch现在应该都已经有所实行了

27.刚翻译了一下这个倒java上

更新时间:2011-02-22 10:02 t By mudie

...[hr] 另外,高人同学可以考虑下这几个问题: 1.词性参与权重计算导致的问题挺多,这点是不是考虑规则权重调整一下? 2.可能是考虑性能问题,采取的局部寻优的办法也导致了一些问题,是不是考虑全局寻优,或者长一些范...

28.XSSearch::setCutOff

...分比低于此值的文档, 值范围 0-100 $weight float 剔除权重低于此值的文档, 值范围 0.1-25.5, 0 表示不剔除 {return} XSSearch 返回对象本身以支持串接操作 源码: sdk/php/lib/XSSearch.class.php#L98 (显示) public function setCutOff($percent, $...

29.XSFieldMeta.weight

weight 属性 public int $weight; 混合区检索时的相对权重 取值范围: 1~63, title 类型的字段默认为 5, 其它字段默认为 1

30.RE: 分词的关键词选择

发布时间:2010-02-26 17:02 t By hightman

你可以利用内置的 scws_get_tops 来获取权重和频率较高的词汇,可以根据词性排除

  • 时间不限
  • 按相关性排序