找到乱码原因了,不过不知道我这个是不是和他们的一样,我是因为没有指定搜索条件,测试的时候谁会想到是这个问题呢,哎。。。
...文章里有很多的字,比如“我,的,在,”这些单字,是不是也会被分出来,我想问的是,能不能取出像地名,人名,词语, 我想在一个网站中应该这些,请问有没有相关的案例可以看一下,谢谢各位,我的服务器是freebsd ...
...250' dateline='1359526203'] 是你自己搞错了! “是一”本身不是词,只是因为二元结合法所以scws自动将其合成为一个词。 复合分词是对原本是词的长词情况处理的,比如”中国“可以切成”中“+”国“+”中国“ 你的问题...
date 字段可以去掉 index = self,INI的注释最好另一起行写。 搜索这么慢可能是硬盘速度太慢了。你是不是加了排序?
...我尝试只搜索4个“self 字段索引”的时候就不会报错,是不是讯搜本身对”self 字段索引“做了限制 只允许至多4个?util/Quest.php 这种方式六个字段索引式的搜索也是too long 而五个确不报错
...原因是他的MYSQL没有安装字符集转换。 此外你的乱码是不是因为你的终端是 GBK 的?请尝试用 util/Quest.php 进行测试吧 util/Quest.php -p entry 小雪 如果乱码就加上 -c gbk 试试
...是我更新所以好像没效果 $index->update($doc); 这样的 是不是要清空后用add ?[hr] Xapian::Query((新闻:(pos=1) AND (type:(pos=2) PHRASE 2 1:(pos=3)))) 这样 但是木有数据
...。 [/quote] 这是 fsockopen 返回的错误,无权限连接?是不是你的PHP限制了SOCKET连接?
不是很明白,你说的自动分词??是什么意思 你在配置文件中不要指定 tokenizer 选项就会自动使用 SCWS 分词了。
...谢管理员,俺想问下,如果在dict_user.txt里加了词汇,是不是要把索引全部重新建立一遍? 如果这个自定义分词是需要不定期的更新的话,有什么好办法没?难道每次都要重新建立索引吗?