搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

41.RE: 分词初试，结果不对

发布时间：2010-09-17 16:09 t By xiaowang19

事实上，我UTF-8的一直不成功，GBK的就会出现那样奇怪的问题今天我又再试了一下（GBK版本的），在Windows下，在文件保存的时候，选择编码“ANSI”，这样就不会出现那样奇怪的问题了

42.RE: LIBSCWS在VS2008下编译错误

发布时间：2013-03-12 15:03 t By jasonniu

是编码的问题已经解决

43.RE: 自定义词库用不了。非常不解啊。。

发布时间：2011-10-21 18:10 t By ci169

哎呀。搞定了。是txt编码问题郁闷。我就是说怎么不行呢。

...ue, XSDocument $doc=NULL) $value string 待分词的字段值(UTF-8编码) $doc XSDocument 当前相关的索引文档 {return} array 切好的词组成的数组源码: sdk/php/lib/XSTokenizer.class.php#L33 (显示) public function getTokens($value, XSDocument $doc = nu...

45.XSDatabase::setUtf8

setUtf8() 方法 public bool setUtf8() {return} bool 如果数据库能直接输出 UTF-8 编码则返回 true 否则返回 false 源码: sdk/php/util/XSDataSource.class.php#L445 (显示) public function setUtf8(){ return false;} 设置数据库字符集为 UTF-8

46.RE: 中文分组粗分方法

更新时间：2010-05-29 01:05 t By baobao

谢谢马老师 [ 应该是吧:-）]的及时回复。我在研读代码的时候，看到有段代码注释着，是对半字的处理，并不是很理解，对于文字都是1-4字节的UTF-8存储编码。半字是种什么情况呢？

47.RE: ［BUG］安装scws运行后竟然乱码

发布时间：2011-06-17 13:06 t By hightman

呃，这中间输出的中文是GBK编码的，如果你的控制台是采用UTF-8，那就乱码。

48.XSUtil::convertOut

...set, 'UTF-8'); } return $buf;} 把 UTF-8 字符串转换为用户编码

49.XSUtil::convertIn

...set); } return $buf;} 把用户输入的字符串转换为 UTF-8 编码

50.使用自定义词库的时候，部分词会丢失

更新时间：2014-04-18 17:04 t By tianly

...现 [off] => 42 [len] => 6 [idf] => 0 [attr] => @ ) 词库文件是UTF8编码的，已经分别试过使用PHP版词库工具以及scws-gen-dict来生成词库，但是结果都一样。有什么可能的原因吗？谢谢 [hr] 我使用的代码如下， dict.utf8.xdb是我自己的词...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

搜索