...447行有问题。 修改xdb.class.php如下: 原来: if ($cmp == false) $cmp = create_function('$a,$b', 'return strcmp($a[key],$b[key]);');//$a[key]这种写法非常不严谨,是低级问题。真不明白定这个函数的人是如何学php的,害人不浅。 改成 if ($cmp == f...
...tf8,则需要修改该程序的第一行,把 define('IS_UTF8_TXT', false); 改为 true php make_xdb_file.php [导入的文本文件] --- 关于文本文件的说明,每行一条记录,#开头表示注释,每条记录由 word、TF、IDF、Attr组成,其中TF是词频系...
...null){ if (!is_int($mode)) { $mode = stripos($fpath, '.txt') !== false ? SCWS_XDICT_TXT : SCWS_XDICT_XDB; } $this->_setting['set_dict'] = new XSCommand(XS_CMD_SEARCH_SCWS_SET, XS_CMD_SCWS_SET_DICT, $mode, $fpath); unset($this->_setting['add_dict']); return $this;} 设置分...
...null){ if (!is_int($mode)) { $mode = stripos($fpath, '.txt') !== false ? SCWS_XDICT_TXT : SCWS_XDICT_XDB; } if (!isset($this->_setting['add_dict'])) { $this->_setting['add_dict'] = array(); } $this->_setting['add_dict'][] = new XSCommand(XS_CMD_SEARCH_SCWS_SET, XS_CMD_SC...
...ws/etc/rules.utf8.ini'); //分词前去掉标点符号 $so->set_ignore(false); //是否复式分割,如“中国人”返回“中国+人+中国人”三个词。 $so->set_multi(false); //设定将文字自动以二字分词法聚合 $so->set_duality(true); //要进行分词的语句 ...
...R::_check_header()里面执行 if ($fstat['size'] != $hdr['fsize']) return false就返回了。请问这说明什么问题呢?[hr] 事实上,$hdr['fsize'] = 13245833, 而$fstat['size']就是dict.xdb文件的大小4497408 ,那为什么$hdr['fsize']会等于13245833呢?
... $pscws = new PSCWS3(); $ignore = $autodis = true; $debug = $stats = false; $pscws->set_ignore_mark($ignore); $pscws->set_autodis($autodis); $pscws->set_debug($debug); $pscws->set_statistics($stats); $pscws->set_dict($dict); //-------这句出现乱码 if (!is_null($textdat...
...。 参数:无 返回值:成功返回类操作句柄,失败返回 false [color=#0000ff]mixed scws_open(void)[/color] 说明:创建并返回一个分词操作句柄 参数:无 返回值:成功返回 scws 操作句柄,失败返回 false [color=#0000ff]bool scws_close(resource ...
...hp] function msubstr($str, $start=0, $length, $charset="utf-8", $suffix = false){ $suffixStr = $suffix ? '…' : ''; $re['utf-8'] = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/"; $re['gb2312'] = "/[\x01-\x7f]|[\xb0-\xf7][\xa0-\xfe]/"; $re['gbk'...
...null){ if (!is_int($mode)) { $mode = stripos($fpath, '.txt') !== false ? SCWS_XDICT_TXT : SCWS_XDICT_XDB; } if (!isset($this->_setting['add_dict'])) { $this->_setting['add_dict'] = array(); } $this->_setting['add_dict'][] = new XSCommand(XS_CMD_SEARCH_SCWS_SET, XS_CMD_SC...