搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

1.[bug] 修正 util.Quest 在指定为非 UTF-8 编码时引起中文乱码的问题

发布时间：2011-11-16 18:11 t By hightman

感谢七夜兄的测试和指出，现在已经作了修正。原因是对输入的编码做了二次校正。改法参见 GIT 仓库，因为输入的数据已经统一转成 UTF-8 了，所以搜索服务端应统一使用 UTF-8 即可。 [url]https://github.com/hightman/xunsearch/commit...

2.数据导入乱码问题

发布时间：2011-11-25 17:11 t By vist2007

...功在本机用sdk 搜索数据英文有结果,其中docs里数据中文的是乱码搜索中文没有结果 $xs = new XS('entry'); $search = $xs->getSearch(); $search->setCharset('utf8'); 有结果中文乱码 $docs = $search->search('whitesnow'); 没有结果 $docs = $searc...

3.RE: 数据导入乱码问题

更新时间：2011-11-25 18:11 t By vist2007

...index->update 之前打印一样 $data 的字段。 2.$data 之前的数据中文乱码您使用哪个方式的 MYSQL 访问方式，之前也有人报告了类似的错误，原因是他的MYSQL没有安装字符集转换。 3.访问方式指什么数据导入用Indexer.php提供的工具。查...

4.RE: ［BUG］安装scws运行后竟然乱码

发布时间：2011-06-17 13:06 t By hightman

呃，这中间输出的中文是GBK编码的，如果你的控制台是采用UTF-8，那就乱码。

5.RE: 安装后，第一个例子，显示乱码

发布时间：2013-03-28 10:03 t By hightman

明显，你的源码是以UTF-8存的，也就是你的中文其实是UTF-8的

6.一个疑问……

发布时间：2007-11-28 22:11 t By 逍遥小妖

... 对于一个页面来说，通常含有数字、英文、英文标点、中文标点、中文等文字要素（可阅读部分，HTML已过滤），视情况而定，搜索引擎还有可能抓出含有乱码的片段。但是SCWS分词时似乎要求字符串中只能有中文和中文标点，...

7.RE: 为什么我更新的索引会没有数据呢？

发布时间：2012-10-18 13:10 t By hightman

是不是你中文乱码了，试试搜索英文字符

8.RE: xunsearch-1.0.1 正式版 (基于xapian/scws/php的开源中文全文搜索引擎)

发布时间：2011-09-30 13:09 t By hightman

主要修改日志： * 09-30 13:11 bdcdacc hightman: PHP-SDK: 修正搜索语句用符号开头时日志前多个空格的问题 * 09-30 12:34 fc47554 hightman: PHP-SDK: 增加相关搜索中 cleanFieldQuery 的判断 * 09-30 11:43 d3408f0 hightman: 在文档致谢中增加 Yii * 09-30 11:31 44f7a...

9.www.adminlink.net.cn上的xunsearch案例

更新时间：2011-12-08 12:12 t By adminlink

首页说下我为什么安装中文分词和全文搜索。就是因为提取出更多的页面，让搜索引擎蜘蛛没完没了的爬，达到网页聚合的目的。这样做我估计对优化很有帮助。选择scws的原因是比较了几个中文分词后，感觉scws是一个不错的...

10.修正utf-8版make_xdb_file.php的错误

发布时间：2011-06-09 09:06 t By itlong

...GBK dictionary　到80行，这是不参对utf-8字符处理的，不能对中文(中英混合)字符进行mb_substr($word, 0, $len)切分,[u]mb_substr($word, 0, $len)切分中文会是乱码的。[/u] 所以要人为添加字符串处理涵数，针对utf-8。 [php] function msubstr($str, $s...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索