[quote='hightman' pid='2097' dateline='1357272615'] 这个日志说的是超时了,也就是说SDK连接上服务端后,5秒过后还没有收到查询请求,服务端强制关闭了这条连接 [/quote] 嗯,测试外部库可以了。本地lo设备关闭了。
在使用scws分词的时候,如果输入40多个“卡”字,最后分出来的那个词少了一个字节,就是说在utf8下原本3字节的一个“卡”字,变成了两个字节,形成了一个乱码。在线测试也会出现这种情况,大家怎么解决啊???
比如说我要切割“Adidas/阿迪达斯是一个著名的运动品牌” 在自定义词库里我添加了"Adidas/阿迪达斯" 但结果是Adidas / 阿迪达斯 请问能否判断是一个自定义的整词吗?就是说按我设置的词库来分
TF就是词频率,也就是这个词在各种语料中出现的机率权重。(越经常出现的越高) IDF是逆词频率,也就是说这个词更重要(因为罕见一些);具体参见:http://baike.baidu.com/view/1228847.html 并没有很固定的算法,SCWS中的tf/idf均...
...数据测试, 以及一段时间的试运行才会有更好的结果。 就是社区稍显冷清。。呵呵 新项目内部命名为super.maria 。 策划了有一段时间了, 功能方面也基本都设计好了 整个项目的基本功能就是, 用户/商家提供信息,让用户来...
建议xunsearch加入TTL特性,就是说每条记录可以设置过期时间,过期后由系统自动回收。 为什么这么考虑: 1.xunsearch原理上是实现了别的数据库无法实现的全文检索功能,数据要靠定期加入或者清理,实际类似缓存系统。 2.靠...
...员 员开 会 发 展 中 国 家 上 海 大 学 城 书 店 ” 就是说连“中国”、“上海”、“美国“和”大学“都找不出来,这是什么问题呢?谢谢!
...你也看到了 绝对没有超过80.但是报错 Data/Name too long 这就是说是Name 太长 而我的搜索语句是六个”self 字段索引“ 当我尝试只搜索4个“self 字段索引”的时候就不会报错,是不是讯搜本身对”self 字段索引“做了限制 只允许至...