ini文件是这样配置的 [php] [active] index = self tokenizer = none [/php] 这个active 只保存1或者0 可是 搜索 [php] $search->setQuery("active:1")->search(); $search->setQuery('active:"1"')->search() [/php] 这样搜不出来啊 加上双引号也搜不出来 是不是这个有最短...
我用官方这样的操作方式来解决一些循环的数据。 以下是官方提供的: $index->openBuffer(); // 开启缓冲区,默认 4MB,如 $index->openBuffer(8) 则表示 8MB // 在此进行批量的文档添加、修改、删除操作 ... $index->add($doc); ... $index->del...
...能给分词出来的。。似乎默认就把一窜数字就是一个词 这样来分[hr] 那如果是这样就麻烦了。。怎么能解决 中文+数字 结合的词呢?
...面做精准搜索: $docs = $search->search('song_name:\'\"大海\"\''); 这样搜出来的结果中,歌名最短的一定是完全匹配的。 [/quote] 引号就不用了。song_name:大海 这样就行了
还可以这样索引啊,学习了。 [quote='hightman' pid='366' dateline='1324273957'] 字段多个值是什么意思呢? 这段值可以只有一个,但可以索引多个词汇。 比如你有一个字段叫 date 存的是 2011-11-07 那么你可以在索引的时候通过 $doc-...
富贵鸟(Y1W) 类似这样的名称分词的结果 却是 富贵 鸟(Y1W) 最关键的 Y1W 没有被分出来。 而且 六灯夜视D502 这样的名称 也只能分出 中文, 英文和数字没有被分出来,是为什么?请教高手。 我用的是SCWS 扩展 PHP 5.2.x 版二...
...索引库,记录 ff 相关的原词来做高亮。 3. 排序内部不是这样计算的,按BM25公式排序,你这样要求似乎做不到。。。另外二次开发xapian或许可以 4. 用的是同样的算法检索 log_db 效率还是不错的
...索引库,记录 ff 相关的原词来做高亮。 3. 排序内部不是这样计算的,按BM25公式排序,你这样要求似乎做不到。。。另外二次开发xapian或许可以 4. 用的是同样的算法检索 log_db 效率还是不错的
在用xunsearch做项目的时候,遇到这样的一个问题,当搜索某一词语,需要统计在有哪些类别。针对这个就需要用到mysql里面的group by了 不知道xunsearch 现在是否有这个功能,或者未来是否能支持这个功能[hr] 晕死,经过查看api后发...
本来按照Hightman的说明。我的文件放置的结构是这样的: “etc”:放置“自定义词典” 我的网站的目录结构是这样: [code]www【根目录】 |---mySite【子目录】 |---include【子目录】 |---使用分词功能的页面.php...