...] 我测试了 2006019 条数据,使用 $index->add() 第一次新建,时间花费了 884秒,速度很快。 搜索时,有时0.5s左右,有时慢 6.2s 左右,关键词长度基本上差不多,结果有点不理想。 硬件信息: R310 至强四核X3430 2.4GHz*1/2G*1 1333MHz/...
...从天涯抓取了一个连载页面测试结果, 45Kb左右的文本切词时间是0.026秒, 换算完毕大概是 1.5MB文本/秒) 测试过程中开启了散字自动二元聚合, 长词自动补切为短词, 开启了人名地名数字智能识别等功能, 基本上是针对搜索引擎专用...
...(由中文字或3个以下的字母合成), "TF", "IDF", "词性", 字段时间用空格或制表符分开,数量不限,可自行对齐以美化。 3) 除“词语”外,其它字段可忽略不写。若忽略,TF和IDF默认值为 1.0 而 词性为 "@" 4) 由于 txt 库动态加...
...(由中文字或3个以下的字母合成), "TF", "IDF", "词性", 字段时间用空格或制表符分开,数量不限,可自行对齐以美化。 3) 除“词语”外,其它字段可忽略不写。若忽略,TF和IDF默认值为 1.0 而 词性为 "@" 4) 由于 txt 库动态加...
...调用 XSIndex::flushLogging 才能确保立即刷新, 否则要隔一段时间 addWeight() 方法 public XSSearch addWeight(string $field, string $term, float $weight=1) $field string 索引词所属的字段 $term string 索引词 $weight float 权重计算缩放...
...操作。 由于清空立即生效会导致搜索中断或不可用一段时间,对于线上服务,建议使用 `--rebuild` 选项实现平滑重建,在导入完成后再将新数据库替换为原数据库。 自定义数据过滤器 --------------- 自从 1.1.1 版本起,在索引工...
...(由中文字或3个以下的字母合成), "TF", "IDF", "词性", 字段时间用空格或制表符分开,数量不限,可自行对齐以美化。 3) 除“词语”外,其它字段可忽略不写。若忽略,TF和IDF默认值为 1.0 而 词性为 "@" 4) 由于 txt 库动态加...