发贴可以发了,之前为了挡垃圾贴搞错了。 我看你代码用的 dict.xdb 那么为何又用 rules.utf8.ini ?
...用的,不用担心性能。 你合并词典很简单啊,把 dict.utf8.xdb 导出来嘛 [/quote] 谢谢hm。还是更加期望加上直接入字典库的功能。这样更加方便,就是不知道难度如何。因为目前我的词库可能每天都有新的加进去。 PS:我是个...
... $scale = 1){ $term = strtolower($term); $term = XS::convert($term, 'UTF-8', $this->_charset); $bscale = ($scale > 0 && $scale != 1) ? pack('n', intval($scale * 100)) : ''; $vno = $field === null ? XSFieldScheme::MIXED_VNO : $this->xs->getField($field, true)->vno; $cmd = new XSCommand...
...了 下是项目ini配置 project.name = study project.default_charset = utf8 server.index =8383 server.search =8384 [user_id] type = id [username] index = self tokenizer = full [password] index = both [email] index = both 后来自己又写了个php页面打印结果是一...
...出自于 PDO 的字符集修正语句,应该统写为没有带引号的 utf8 兼容性最高。 如果您在使用 INDEXER 时一直有乱码现象,请按以下方法修改一下 $prefix/sdk/php/util/XSDataSource.class.php 详见补丁文件: [url]https://github.com/hightman/xunsear...
...ion getIterator(){ if ($this->_charset !== null && $this->_charset !== 'UTF-8') { $from = $this->_meta === null ? $this->_charset : 'UTF-8'; $to = $this->_meta === null ? 'UTF-8' : $this->_charset; return new ArrayIterator(XS::convert($this->_data, $to, $from)); } retur...
...文混合分词都无效。 譬如: $so = scws_new(); $so->set_charset('utf8'); $so->set_dict('words.txt',SCWS_XDICT_TXT); $so->set_ignore(true); $so->send_text("GMhello指导员"); echo ''; while ($tmp = $so->get_result()) { var_dump($tmp); } $so->close(); 在words.txt只定义如下内容 GM 1...
....ini中我设置如下: project.name = article project.default_charset = UTF-8 [aid] type = id [title] type = both [smalltitle] type = string [copyfrom] type = string [totalhit] type = string [keywords] type = string [sendtime] type = numeric 在添加索引时,文档中有说会自动转...
...Document $doc=null){ $charset = is_object($doc) ? $doc->getCharset() : 'UTF-8'; $ret = array(); //如果词的总长度小于给定的长度,则直接返回该词 $strlen = mb_strlen($value,$charset); if($strlen length) { $ret[] = $value; return $ret; } for($l=$this->l...
...n']); 不可能超過 1gb 我有看到 gen_dict.c 但是是有有繁體utf8的 dict.txt 可以讓我自行編輯 麻煩 hightman 大大 [/quote] 这样的错误可能是运行的平台的字节序不一样或者.xdb文件已损坏所导致的. 我发一份我这边正确导出的词库吧...