...在 scws_send_text 之后调用,scws_has_word 用于判断文本中是否包含 xattr 词性的词汇,常用于脏词判断,将脏词统一设为一个词性。 3. scws_get_words 返回词性属于 xattr 的词汇列表,返回顺序为词出现的先后顺序,词的结构和 get_tops ...
...系,有些长词其实可以细分为短词。 比如当一篇文章中包含“管理制度”的时候,它被分为“管理制度”“管理”“制度”三个词,无论搜索这三个词中的某一个都可以检索到。 当用户输入 “管理制度” 的时候则只搜索...
在 6,562,251 条数据中,大约有 1726139 条包含 中国 ,第 1-10 条,用时:15.7350 秒。 数据大概这么多,是用csv格式导入的。 下面是我的配置文件 project.name = test_qw project.default_charset = utf-8 server.index = 8383 server.search = 8384 [docn...
... public void connect(array $param) $param array 连接参数, 包含: user,pass,host,table,dbname ... 源码: sdk/php/util/XSDataSource.class.php#L621 (显示) public function connect($param){ $host = isset($param['host']) ? $param['host'] : ini_get('mysqli.default_host'); $u...
...在 scws_send_text 之后调用,scws_has_word 用于判断文本中是否包含 xattr 词性的词汇,常用于脏词判断,将脏词统一设为一个词性。 3. scws_get_words 返回词性属于 xattr 的词汇列表,返回顺序为词出现的先后顺序,词的结构和 get_tops ...
... $xattr {return} array 返回词汇数组, 每个词汇是包含 [times:次数,attr:词性,word:词] 源码: sdk/php/lib/XSTokenizer.class.php#L361 (显示) public function getTops($text, $limit = 10, $xattr = ''){ $words = array(); $text = $this->applySetting($text); ...
... 方法 protected string makeDsn(array $param) $param array 包含 path 为数据库路径 {return} string 源码: sdk/php/util/XSDataSource.class.php#L945 (显示) protected function makeDsn($param){ $dsn = 'sqlite:' . $param['path']; return $dsn;} 生成 SQLi...
[quote='lyhuc' pid='3803' dateline='1288194553'] 打不开这个ZIP包,提示损坏,可否重新发布一下? [/quote] 直接下载最新的 scws-1.1.3.tar.bz2 就包含相应的DLL包了,详见主页 http://www.ftphp.com/scws
...移量, 即跳过的结果数量, 默认为 0 $stemmed bool 是否包含处理过的词根同义词, 默认为 false 表示否 {return} array 同义词记录数组, 每个词条为键, 同义词条组成的数组为值 源码: sdk/php/lib/XSSearch.class.php#L164 (显示) public ...
...出“某词”, scws_get_tops(s,1000,NULL); 而下面判断却没有包含这个词 if( scws_has_word(s,"*")) //"*"用NULL代替也不行 另外我用函数scws_set_ignore(s,1),怎么去不掉文本中的空格等特殊字符[hr] 我用的版本是scws-1.1.2