[quote='hightman' pid='1358' dateline='1350873104'] 这不太科学啊,最好给个页面看看。是不是因为缓存? [/quote] 我重启了一下,好了。。。
...,然后根据自己需要生成 tokens 就可以了。 二元分词并不是直接分成N长的若干段,而是 ABCD => AB + BC + CD 你的作法会把 ABCD => AB+CD 这样搜索 BC 就搜索不到了。。。
通常英文是不需要分词的,但很多时候词性是需要的,比如nike,dior这类品牌英文。 目前默认词性都是en,有什么办法可否自定义词典来改变他的词性。 还有个问题,就是纯数字的词性为什么是en呢,不是m? 望赐教。
refused说明服务端连不上,是不是你的服务端绑定的情况不对?netstat -an | grep 8383 看看?
[quote='caixun2002' pid='697' dateline='1333531606'] 额,楼上想做个千度么,那得好好研究呢。 [/quote] 呃,不是千度,而是有大量html的页面,但是没有办法用xunsearch,感觉很遗憾的!
...个词的也能搜得到 千万 千年 千* 我搜索 那 出现的 是不是完整词的 比如等到胜利那一天,都市那点事,世界那麽大,帕那索斯博士的奇幻秀。。。可是我想搜的 “那些年,我们一起追的女孩”确没有出来,请管理员指教 ...
其实我们提供的搜索方案是提供API的,简单来说就是你可以通过API维护数据。至于如何同步完全取决于你的作法和设计,至于JOIN也一样,这个本身不是XUNSEARCH的功能 但我们提供的辅助工具 Indexer.php 也支持 JOIN语句和多表导入。