index=self 是对的。 你的cat_id是数字吗? getAddTerms 打印出看下。 如果有index,有term。查不出应该是不可能的.
如果我每次都只叠加一点点词语 估计就5-6个是否每次叠加完成都要执行 $xdb->Optimize();函数? 因为执行这个$xdb->Optimize();要等很久... 能不能周期性的优化? 就是新加的差不多数量了比如100个了就手动执行一次$xdb->Optimize();? ...
...来的索引,以至于,再有进程进行查询,报错!! 比如如果库名是db, 他会删除db 然后建一个db.re,开始建索引, 建完索引,好像又改名为db 如何处理呢,期望直接建 db.re,建好后,删除db.再更名db.re为db呢
如果你了解scws就会知道它其实对散字也是自动二元处理。 你所谓的一元是一个字一个词?你也可以拓展 XSTokenizer 自己实现分词
就一条记录怎么会有4M?如果文件 已存在生成是不会覆盖的啊 你描述的并不是很清楚,你用的是PHP的工具还是C的转换工具呢?一个.TXT对应转换成一个.XDB
你这个应该是指SDK吧,目前我们暂时不会出。 如果有既懂PHP又懂JAVA的,应该很容易可以把 PHP 的SDK改为 java