抱歉,这里没有讲清楚,英文,数字本身不需要设置会自动根据词界切割。 这里说的是那些中英混合的特殊词汇,限制了夹带的字母只能1个或2个字符。 比如:我有很多Q币,这里Q币你如果设为词,它可以被切出。 再比如:我...
...(string $name) $name string {return} XSSearch 返回对象本身以支持串接操作 源码: sdk/php/lib/XSSearch.class.php#L492 (显示) public function addDb($name){ $name = strval($name); $this->execCommand(array('cmd' => XS_CMD_SEARCH_ADD_DB, 'buf' => $name)); $th...
如果你仔细阅读过 http://www.xunsearch.com/doc/php/guide/ini.guide#ch2 应该会发现,date 字段本身就只是 YYYYMMDD 这样的格式,如果你需要时分秒,请改为存储时间戳或者存储时间字符串吧。
... $yes bool 是否忽略 {return} XSTokenizerScws 返回对象本身以支持串接操作 源码: sdk/php/lib/XSTokenizer.class.php#L256 (显示) public function setIgnore($yes = true){ $this->_setting['ignore'] = new XSCommand(XS_CMD_SEARCH_SCWS_SET, XS_CMD_SCWS_SET_IGNORE, $ye...
...,以文件名为key,内容为body建索引不就好了? xunsearch 本身并不是完整的搜索引擎,它是提供核心组件并附带一些例子 [/quote] 如果是页面结构相似的网页,像H大这样做更好。
...set) $charset string {return} XSTokenizerScws 返回对象本身以支持串接操作 源码: sdk/php/lib/XSTokenizer.class.php#L242 (显示) public function setCharset($charset){ self::$_charset = strtoupper($charset); if (self::$_charset == 'UTF8') { self::$_char...
是你自己搞错了! “是一”本身不是词,只是因为二元结合法所以scws自动将其合成为一个词。 复合分词是对原本是词的长词情况处理的,比如”中国“可以切成”中“+”国“+”中国“ 你的问题必须是 [code] $tk = $tokenizer->s...
...字自动二分组合功能 {return} XSTokenizerScws 返回对象本身以支持串接操作 源码: sdk/php/lib/XSTokenizer.class.php#L316 (显示) public function setDuality($yes = true){ $this->_setting['duality'] = new XSCommand(XS_CMD_SEARCH_SCWS_SET, XS_CMD_SCWS_SET_DUALITY, $y...
...g $charset) $charset string {return} XSSearch 返回对象本身以支持串接操作 源码: sdk/php/lib/XSSearch.class.php#L69 (显示) public function setCharset($charset){ $this->_charset = strtoupper($charset); if ($this->_charset == 'UTF8') { $this->_charset ...
...索语句, 最大长度为 80 字节 {return} XSSearch 返回对象本身以支持串接操作 源码: sdk/php/lib/XSSearch.class.php#L227 (显示) public function setQuery($query){ $this->clearQuery(); if ($query !== null) { $this->_query = $query; $this->addQuerySt...