发现xunsearch很有前途的。 如果能够再将爬虫部分也一起组合起来,并提供前端PHP页面。。。提供一体化的解决方案就更方便了。。。。
我一直在关注您开发的分词,已经在很多项目中使用 突然发现您公布了开源搜索方案,很是惊讶,很感谢您的辛勤付出。 我想请教几个问题: 1.是否支持增量索引自动化。也就是自动把新数据加入索引。 2.是否支持join查询
[quote='hightman' pid='432' dateline='1326431112'] 对于字段搜索,内部转换时会自动加上一些括号,所以可能超标了。 [/quote] 那只能缩短搜索语句了呀?有什么其他方案么?老是给你添麻烦,呵呵 ,抱歉那。
其实我更应该感谢你,这个程序做的非常棒。我找了很多分词的方案,做得如此精炼的只有这一个。 这个错误造成的coredump 是无法预测的地方,所以非常难定位。
...标了。 [/quote] 那只能缩短搜索语句了呀?有什么其他方案么?老是给你添麻烦,呵呵 ,抱歉那。 [/quote] 呆会发布1.3.0把长度扩大到200字节
其实我们提供的搜索方案是提供API的,简单来说就是你可以通过API维护数据。至于如何同步完全取决于你的作法和设计,至于JOIN也一样,这个本身不是XUNSEARCH的功能 但我们提供的辅助工具 Indexer.php 也支持 JOIN语句和多表导入。
一个项目支持255个字段,你可以考虑合并为同一套字段方案,只要一个INI。 若实在需要分库,想办法合并结果吧。。。
... ~~~ [php] $text = '迅搜(xunsearch)是优秀的开源全文检索解决方案'; $words = $tokenizer->getResult($text); print_r($words); ~~~ ### 提取重要词汇 调用 [XSToenizerScws::getTops] 可以简单提取重要词汇,它支持三个参数, 返回的词汇数组元素和分词结...