是你自己搞错了! “是一”本身不是词,只是因为二元结合法所以scws自动将其合成为一个词。 复合分词是对原本是词的长词情况处理的,比如”中国“可以切成”中“+”国“+”中国“ 你的问题必须是 [code] $tk = $tokenizer->s...
[quote='hightman' pid='1100' dateline='1347001498'] 是不是你启用了 beginRebuild() 却没有 endRebuild() 关闭它? [/quote] 没使用beginRebuild() ,系统会不会自己在一端时间后,或者发生什么状况后自己启动beginRebuild() ,反正就是增加不进去,...
...e='llkk0914' pid='4262' dateline='1371959040'] 你调换服务器了, 是不是之前的搜索记录没有拿过来, 搜索建议应该是根据搜索的log来的吧 [/quote] 难道真的是吗?我竟然把原来数据库上的传到另外一个服务器上,运行成功了,晕! 谢谢楼...
和楼主几乎一样 生成了一个db_o的文件,而不是re_db 然后索引生成完毕,就将db清空了,但是db_o并未改名过来,必须手动改过了,是什么情况[hr] 又重建了一次,数据全丢了... 啥情况啊[hr] 问题挺严重的,也是自己写的程序,平滑update了几...
就一条记录怎么会有4M?如果文件 已存在生成是不会覆盖的啊 你描述的并不是很清楚,你用的是PHP的工具还是C的转换工具呢?一个.TXT对应转换成一个.XDB
请仔细看说明,$so->get_result() 并不是一次调用,需要多次调用直到返回FALSE 例子1. 使用类方法分词
就是搜索到结果有20多万条 但是排在前面的并不是权重设定较大的 然后在代码中增加计算权重的日志 发觉只是计算很少的文档权重 那是依据什么排序的呢
我的也无法加载,php版本为5.3. 估计不是路径问题,是php版本问题。感觉现在服务器系统用windows的很多。建议也重视23版的开发和升级,比如加入get_tops等
时间精力有限,多点耐心看看还是可以的。 毕竟这是面对技术人员的,不是一般用户。谢谢理解