mblen 只是个指针,指向的是在 charset.c 中定义的全局变量,应当已经是共用的了; 至于 mode 看需要吧,只是一个整型 ,如果你在不同线程中切分建议各自用一个 mode ,除非你自己能确定它们的切词设置是共用的(主要用于保存...
词典没配好吧 有没有在 ini_get('scws.default.fpath') 下面放置词典和规则集文件呢?
奇怪你这个问题我这不能复现。 我完全复制了你的代码,执行若干次结果仍然是正确的,返回三个词,每个的次数均为 1 [attachment=37] [attachment=38]
[quote='hightman' pid='5447' dateline='1387443918'] addRange 后会影响概率计算,count 会有问题 [/quote] 有什么什么方法能得出相对准确的count呢,数据量小时count没有问题,大的时候差别非常大
这是C/S程序,fread是从网络上读取数据。应该是你要看性能要看服务端的,你这个应该是文件系统没有缓存所以第一次比较慢。
已经查明原因了。php5.2.0以前__toString 只有在独立的 echo,print语句才有效,所以出现大量错误,经过仔细考量,决定将 xunsearch 的最底PHP要求提升到 php5.2.0
我刚才讲错了,这个错误意思是无法写入 $prefix/tmp 目录,你看看文件是事存在 其实你也可以看一下 tmp/indexd.log 末尾几行看看怎么说,里面会有相应的错误信息 tail -100 tmp/indexd.log