由于分词规则开头会先进行中英文粗分,那时就强行把数字、字母与多字节的汉字拆分开。 只有夹在汉字中间的1~2个数字或字终才被允许和汉字组合,比如“T恤” ”Q币“ 这种。 假设你的词典里有”北海36“,被分的句子是...
1. SDK 上无所谓顺序,内部会先排序再 collapse 2. 数字型的字段需要用于排序和区间查的时,务必采用 numeric 类型 3. 总数是估算的,因为分页越后在越准确一些(特别是在排序+区间的时候委容易偏差,把计数单独调用 ::count ...
1. SDK 上无所谓顺序,内部会先排序再 collapse 2. 数字型的字段需要用于排序和区间查的时,务必采用 numeric 类型 3. 总数是估算的,因为分页越后在越准确一些(特别是在排序+区间的时候委容易偏差,把计数单独调用 ::count 并...
没有啊,目前为止在 1.4.6 后没有人汇报这个情况哦。从你前面的日志看的意思就是在搜索时发生了索引库变动,但这也不可能死机啊。 xunsearch 内部会定时启动 xs-logging 整理搜索日志,这可以在 tmp/index.log 里看到相关记录。
1. 应该可以查到,问题大概出在你的 type:电影 上,是否给字段做了正确的索引? 2. 似乎没什么好办法,如果量小你可以把 ff设置为 芬芳、非凡、风范的同义词,但从你的量看这个方法应该不可行。你可以尝试另外做一个索引...
1. 应该可以查到,问题大概出在你的 type:电影 上,是否给字段做了正确的索引? 2. 似乎没什么好办法,如果量小你可以把 ff设置为 芬芳、非凡、风范的同义词,但从你的量看这个方法应该不可行。你可以尝试另外做一个索引...
pscws4和scws大致相同的算法,只是后来pscws4没有再进一步更新了。 粗分毕竟只是粗分,要想正式用只用其中一种肯定是不够的。 scws 里面先按逐字把所有可能的词都列出来,建成一个2维表,然后把有岐义的部分拧出来,以其...
1.2.0 起提供了 php 5.3/5.4 的 non-thread-safe 的DLL了
多谢报告,刚刚测试了一下,我的测试 结果不是完全和你相同。 1. 如果 db 不存在而只存在 db2,指定 -d db2 会报错(这是BUG) 2. 如果 db ,db2 都存在,我指定 -d db2 则只会显示 db2 的结果 ,并不是如您所说的 db+db2 -d db,d...