汗,看来就是因为“\r”问题。 hightman老兄,你是用那个来判断换行的?\r\n ?[hr] 测试了一下windows下你使用的是“\n”,linux下你是不是使用了"\r\n" ? 汗,本地windows,服务器linux........ 继续测试。。。
...9526203'] 是你自己搞错了! “是一”本身不是词,只是因为二元结合法所以scws自动将其合成为一个词。 复合分词是对原本是词的长词情况处理的,比如”中国“可以切成”中“+”国“+”中国“ 你的问题必须是 [code] $...
...-Front 和 登陆服务器连mysql查看数据 此外你的乱码是不是因为你的终端是 GBK 的?请尝试用 util/Quest.php 进行测试吧 4.测试中文没有结果 util/Quest.php -p entry 小雪 如果乱码就加上 -c gbk 试试 [hr] 找到 原因了 驱动用的是 XSDatabasePDO_M...
@FIXME: 先记录一下,这是因为你既是自定义分词器又指定了 non_bool 参与权重计算。 那么 SDK 端先按自定义分词器拆分重新组合成查询语句,发送到 xapian 解析器时由于不是 boolean prefix,因此它又会调用内部切词法再次切割。 简...
...者自己根据词性直接在取得返回值的时候排除它。。 因为你是包含的作法的话,是不是“人们”“人家”“人民”全都要过滤了??这样肯定不合适,所以建议直接根据词性过滤吧。这些无意义的词词性通常可以确定的!
...上 AND (time:2011 OR time:2010) 效果可能会比 compare 快多了。 因为在测试时我选择任意时间反而经常比2年内反应快一些。
这个问题已经提过了。。。暂无好办法,建议另行调用不加排序的 count() 因为概率估算的关系,你区间过滤+排序就导致概率失效
...] 你好,先谢谢你的回复。 我的系统环境是 centOS5 因为我linux的功底基本没有,所以也不能判断系统中是否装有两个php。我手动把php装在 /usr/local/php 中,是编译安装的,我用 find 令命搜索的结果是: find / -name php -print /...
... [/quote] 是阿,这个问题很验证,能否不用估算这个?因为毕竟还没到百度那个等级,要一个相对准确的count,希望可以解决
..."一件衣服" 代码匹配出来相关度最大的是"你看的书",因为有2个词相同,而按照我们人的字面理解,相似度最大应当是"一件衣服" ,但这个只有1词个相同,所以程序就判断没有2个词相同的相关度大。 这个问题可能涉及到对...