事实上,我UTF-8的一直不成功,GBK的就会出现那样奇怪的问题 今天我又再试了一下(GBK版本的),在Windows下,在文件保存的时候,选择编码“ANSI”,这样就不会出现那样奇怪的问题了
看了一下基本上说内置了中文分词 内置中文分词 好处我想应该索引会相对的小一些 但是坏处就是要维护词库 新出词语不用立马根据 所以问一下是否支持一元分词 这样就可以实现类似mysql like方式的搜索了
我看了那个文档,发现有一种是文件数据源,还有一种是SQL库的数据源 但是纯HTML页面,如何收录或者生成索引? 比如www下面某个文件夹全是html格式的静态页面,这样的情况怎么弄啊?
在xunsearch缓存仅仅用于缓存ini文件,所以基本上不需要用到memcached这样重型需要TCP连接的开销。 因为一台服务器上你也不会开多少个搜索项目啊,就算没有缓存问题也不大。 目前自动支持apc\eacc\xcache
多词搜索时出来的结果,匹配度有问题,能查到percent()的值是怎么算出来的吗? [img]http://img19.wal8.com/img19/238493_20120306205136/p16nk0opk2rft1qi619v18ta1lla1.png[/img] 匹配度为什么是这样呢?
...ge('id', 1, 243239)->search()能搜出结果 query 语句解析出来是这样的 "Xapian::Query(VALUE_RANGE 0 31 243239))" 无结果 "Xapian::Query(VALUE_RANGE 0 1 243239))" 有结果 请问下为什么?