返回的时候根据长度排除啊,GBK的话单字就是2字节,很好判断啊,UTF-8三字节,但也能判断出是不是一个单个的汉字
能否试试打印 add_dict 的返回值,在异常的时候看看是不是 true~ 看了你的贴子我特地再做了一翻测试,add_dict,无没问题。我的相关代码及设置: 1. php.ini的设置 [code] [hightman@d1 hightman]$ php -i | grep scws scws SCWS BugReport => http://w...
请教个问题,安装的时候报错 [img]http://b255.photo.store.qq.com/psb?/V14e8G6529zQ61/wRqMn1DC*nUyy*VssKmSrmjh9Mpst9WHkUwi*c6zmeg!/b/dMIcB5iTGAAA&bo=0AKQAQAAAAABAGQ!&rf=photoDetail[/img] 这是什么原因呢?
通常全文检索是按词构建反向索引。 即以词条为线索,记录包含该词的文档ID~~ 检索的时候将用户的输入切词后在索引中查找出合适的文档ID再返回。
...type为numeric,结果也是一样。 其它字段使用addRange搜索的时候,发现返回的总数误差都很大。 请问是我的设置有问题,还是搜索条件的写法有问题?
...属性设为 ! 即可。或者自己根据词性直接在取得返回值的时候排除它。。 因为你是包含的作法的话,是不是“人们”“人家”“人民”全都要过滤了??这样肯定不合适,所以建议直接根据词性过滤吧。这些无意义的词词性...
...我们这里限制到100页 我发现如果搜索结果较多排序的时候引起首次搜索时间特别长 是默认排序的2-3倍时间 我想能不能API加入一些特征 进行快速的过滤 比如前2000条结果外的就不统计了[hr] 仔细想下 这个需求意义不大 200万个...
把pscws3加入ecshop中加载字典的时候出现乱码。 require(dirname(__FILE__) . '/pscws3/pscws3.class.php'); $dict = './pscws3/dict/dict.xdb'; // 建立分词类对像, 参数为词典路径 $pscws = new PSCWS3(); $ignore = $autodis = true; $debug = $stats = false; $pscws->set_...
是不是我没有表达清楚 1、我在使用--stop-rebuild的时候,我在服务端看到的不是服务器在调整,而是真真实实的在重建索引,因为我能观察到服务器端会生成一个db.re目录,然后目录会一致变大。 在api端可以能看出重建索引多...
版主您好,我在自定义词表里加了一些数字+字母的词,如pm2.5,101大楼这样。 使用的时候发现无法正常分出来,我看到新版是加了一些强制拆分的功能,但是对自定义词表里的词,也是强制拆分的码?