搜索为了效率,计数是采用概率估算的,没有必要获取准确。 如实在有必要,可以在调用 search() 方法之前构造一个明显很大的 setLimit() 参数去调用
dict_user.txt 里写是对的,词性不要用叹号,随便写个别的吧。叹号表示删除此词,不分就要让它成为词啊。
1-2: 无法计算哦,最大化的利用呗 3. 并发没有任何硬性限制,只要硬件条件许可就可以,主要还是看 qps 吧,可以拿 ab 压压看 4. 当然不是把索引库缓存到内存了,但OS会有一部分文件缓存。
换一种方式解决啊,逐级添加父分类 比如一条数据的分类ID是 9,分类9的父ID是3,分类ID3的父分类是 1 那么你给文档创建索引的时候,通过 $doc->addTerm() 给全部祖先分类ID:3,1 也建立索引不就好了。然后检索 3/1也能检索到分类...
...呢,仔细看一下这里,http://www.xunsearch.com/doc/php/guide/index.rebuild // 这里是开始,所有的索引操作都放在里面,update操作会先执行删除操作,然后执行add操作,update也可以的 $index->beginRebuild(); $data = array(); $doc = new XSDocument; $doc->setFil...