...,然后根据自己需要生成 tokens 就可以了。 二元分词并不是直接分成N长的若干段,而是 ABCD => AB + BC + CD 你的作法会把 ABCD => AB+CD 这样搜索 BC 就搜索不到了。。。
其实我们提供的搜索方案是提供API的,简单来说就是你可以通过API维护数据。至于如何同步完全取决于你的作法和设计,至于JOIN也一样,这个本身不是XUNSEARCH的功能 但我们提供的辅助工具 Indexer.php 也支持 JOIN语句和多表导入。
你编译的SCWS.SO和所用的PHP不是同一个版本。。。重新用对应配套的 phpize php-config 吧,如果你的系统有默认装的早先的php 请在 ./configure 中明确的用 --with-php-config=.... 指定真正在用的PHP-CONFIG
...search/dict.film.txt'); echo "\n-------\n"; 看看你的 dict.film.txt 是不是真的写入了?
...一个索引库,记录 ff 相关的原词来做高亮。 3. 排序内部不是这样计算的,按BM25公式排序,你这样要求似乎做不到。。。另外二次开发xapian或许可以 4. 用的是同样的算法检索 log_db 效率还是不错的
...一个索引库,记录 ff 相关的原词来做高亮。 3. 排序内部不是这样计算的,按BM25公式排序,你这样要求似乎做不到。。。另外二次开发xapian或许可以 4. 用的是同样的算法检索 log_db 效率还是不错的
[quote='hightman' pid='4106' dateline='1299821709'] 是不是你创建的XDB文件没有调用相应的optimize方法 ? php里有一个 $xdb->Optimize(); 这是在创建文件后必须调用的,即使不调用,效率也不会像你描述的这么慢吧。 [/quote] 有运行优化函...
...原因是他的MYSQL没有安装字符集转换。 此外你的乱码是不是因为你的终端是 GBK 的?请尝试用 util/Quest.php 进行测试吧 util/Quest.php -p entry 小雪 如果乱码就加上 -c gbk 试试
多谢报告,刚刚测试了一下,我的测试 结果不是完全和你相同。 1. 如果 db 不存在而只存在 db2,指定 -d db2 会报错(这是BUG) 2. 如果 db ,db2 都存在,我指定 -d db2 则只会显示 db2 的结果 ,并不是如您所说的 db+db2 -d db,d...
[quote='hightman' pid='3990' dateline='1294802102'] 从错误提示看并不是找不到路径,而是加载时出现未定义的函数。 是不是你编译scws-1.1.5所有的 phpize以及php-config 和你正在用的不匹配?如果你安装了多个版本的PHP,请指定正确的 phpize ...