需求是,我需要对一些内容的分类,采取不同权重设置,而对于一些无分类的内容使用较低权重(不能直接过滤,我希望没分类的内容能搜索到,只是希望排序靠后)。 demo中的案例使用没有问题,在实际开发中,发现没有起作...
呃确实存在,这都跟这个词库有关系,是互联网上整理的词库,像“法上”居然是专有名词而且权重很高。。。 可以考虑删除“法上”这个错误的词,外挂一个文本词典把“法上”标记为删除或设成更低权重及词性
可以添加对词性的判断,以及词性的权重比,应该可以达到你想要的效果~ 例如:在SCWS分析以上三句词性得到: 你/r 给/v 我/r 买/v 的/uj 衣服/n 你/r 看/v 的/uj 书/n 一/m 件/q 衣服/n 以此可以看出,其中匹配的是 你/r 的/uj 衣服/n ...
...8.10 i WORD ATTR我都能理解。 上贴说的逐字分词后 计算权重的时候使用IDF,貌似就是类似基于字典的最大概率方式来定义权重,或者说是对于歧义的取舍。 TF IDF 具体是指什么? 使用的概率计算公式能阐述下么? 谢谢。
...词 -> 搜索匹配 -> 前10个结果取样(比如取共有的标签 按照权重分配标签权重) -> 输出 这些元素xunsearch现在应该都已经有所实行了
...[hr] 另外,高人同学可以考虑下这几个问题: 1.词性参与权重计算导致的问题挺多,这点是不是考虑规则权重调整一下? 2.可能是考虑性能问题,采取的局部寻优的办法也导致了一些问题,是不是考虑全局寻优,或者长一些范...
...分比低于此值的文档, 值范围 0-100 $weight float 剔除权重低于此值的文档, 值范围 0.1-25.5, 0 表示不剔除 {return} XSSearch 返回对象本身以支持串接操作 源码: sdk/php/lib/XSSearch.class.php#L98 (显示) public function setCutOff($percent, $...
weight 属性 public int $weight; 混合区检索时的相对权重 取值范围: 1~63, title 类型的字段默认为 5, 其它字段默认为 1