我用csv进行添加,多个csv文件每次ID都要是连续依次增加吗??用Indexer.php添加第二个时会清空第一次添加的内容吗??csv文件的id序列号重复了可以吗??
...配置的原因么? 我在网站上在线分词那输入中英文确是可以混合的,比如关键词输入“我是test中国人”,在线分词会给出“我是 test 中国人 中国 国人 ”,这是什么情况呢? 我的环境是:win7+php5.4+scws的
...目中 搜索日志词 word util/Logger.php --del=word demo 这样就可以了, 可是现在有个问题,搜索日志里面有一个是乱码 我该如何删除呀?
为确保服务器性能,采用空闲时写入。但不至于1-2小时,是不是有其它情况。可以尝试: util/Indexer.php --flush
...字符。 比如:我有很多Q币,这里Q币你如果设为词,它可以被切出。 再比如:我有很多abc币,如果你设置了abc币为词,它仍然无法切割,会被预处理器先切为 我有很多 + abc + 币
[quote='KnightE' pid='334' dateline='1323542477'] 应该尽量通过xs得到id,然后根据id批量从DB/NOSQL取信息,直接从xs取信息不是个好主意。 [/quote] 取信息可以从DB/NOSQL取信息,但是涉及到从XS过滤 就是个问题了
不明白你说的具体什么意思。 addWeight 的权重可以是小数,注意微调。这个加的不是字段而是针对包含指定索引词的文档提权。