搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

发布时间：2014-04-22 15:04 t By zhoutian

在使用scws分词的时候，如果输入40多个“卡”字，最后分出来的那个词少了一个字节，就是说在utf8下原本3字节的一个“卡”字，变成了两个字节，形成了一个乱码。在线测试也会出现这种情况，大家怎么解决啊？？？

发布时间：2012-10-18 13:10 t By hightman

是不是你中文乱码了，试试搜索英文字符

发布时间：2009-05-26 09:05 t By hightman

XDB不可轻易修改, 需要借助工具转换纯文本为xdb, 添加和修改词不太方便还有二楼的代码是手册里的讲解,并不是要你抄进去. scws_get_tops() 返回的 attr 带有乱码是因为 windows 的 dll 较早所以才会有这样的BUG, 问题不大

更新时间：2014-04-26 10:04 t By smarteng

...可以了，可是现在有个问题，搜索日志里面有一个是乱码我该如何删除呀？

更新时间：2009-05-25 21:05 t By pardis_xiong

... [attr] => nz融 ) attr是什么呢？而且，为什么是乱码。[hr] 对了斑竹，xdb可以修改么，我想向里面添加新词。

发布时间：2012-08-13 21:08 t By hightman

ini错误啊，type=both没有这样的语法。 numeric 你要有 $doc->sendtime 访问就可以了，应该不会乱码。print_r()返回的是序列化后的字符串啊，不必理会。

发布时间：2012-08-13 21:08 t By hightman

ini错误啊，type=both没有这样的语法。 numeric 你要有 $doc->sendtime 访问就可以了，应该不会乱码。print_r()返回的是序列化后的字符串啊，不必理会。

发布时间：2012-11-27 13:11 t By hightman

这是PHP的safe mode 导致的，自己配置好就行了。命令行测试时乱码大概是编码不对，你可以尝试在命令后加上 -cgbk

发布时间：2007-11-28 22:11 t By 逍遥小妖

...HTML已过滤），视情况而定，搜索引擎还有可能抓出含有乱码的片段。但是SCWS分词时似乎要求字符串中只能有中文和中文标点，否则就会分词失败。请问这个是我对SCWS的使用方法不正确还是SCWS目前只能做成这样？目前我企...

更新时间：2011-09-26 11:09 t By hightman

现在网页上下载的已经全部统一为GBK编码了，目前测试在MACOS下面不会乱码了。看抓图