不明白你说的具体什么意思。 addWeight 的权重可以是小数,注意微调。这个加的不是字段而是针对包含指定索引词的文档提权。
什么意思 SCWS_XDICT_MEM 应该会比普通的慢吧,要加载到内存。 这个方式适合于常驻程序多次分词,WEB上不推荐。
搜索为了效率,计数是采用概率估算的,没有必要获取准确。 如实在有必要,可以在调用 search() 方法之前构造一个明显很大的 setLimit() 参数去调用
dict_user.txt 里写是对的,词性不要用叹号,随便写个别的吧。叹号表示删除此词,不分就要让它成为词啊。
1-2: 无法计算哦,最大化的利用呗 3. 并发没有任何硬性限制,只要硬件条件许可就可以,主要还是看 qps 吧,可以拿 ab 压压看 4. 当然不是把索引库缓存到内存了,但OS会有一部分文件缓存。
换一种方式解决啊,逐级添加父分类 比如一条数据的分类ID是 9,分类9的父ID是3,分类ID3的父分类是 1 那么你给文档创建索引的时候,通过 $doc->addTerm() 给全部祖先分类ID:3,1 也建立索引不就好了。然后检索 3/1也能检索到分类...