我已经排查了 nginx 和 php 等所有可能的cache 。真的没有了 就是死活不更新。 Hm 真的不行,那个字典 完全看不出啥问题
单字标为 @ 是以前遗留下来的, 未确定词性, 还有一部分被标为 un 了, 建议把 un 改为 '@' ,否则可能导致散字自动聚合成2元分词时会不聚合.
从结果看应该是 scws_set_dict(s, "/usr/local/etc/dict_chs_gbk.xdb", SCWS_XDICT_MEM); 这句话出了问题, 也就是可能词典不正确. 但这个词典目前测试在64位系统下也是可以正常工作的, 检查一下词典的字节数是不是没有下载完整.
场景: 一个产品名称A,他可能有B、C、D三个别名。数据库中别名是存在另外一个数据表中的,有B、C、D三条记录,对应到产品A上。对于索引的话,我之前用的solr 它有个字段multiValued="true"支持。不知道迅搜怎么做?
... 再说一下如何分库 像你这样的贴子,应该说旧贴子不太可能再发生删除、修改等操作;建议按时间段切割,但不建议分割过多。 在索引数据入库时根据时间判断该对应哪个库名,比如用 db_1, db_2, ... 来区分 而在搜索的时候统...
...g][/url] 一些主要的数据结构,借鉴了jabberd2吧, [/quote] 不可能吧,只有一个 pool.c 是参考了 jabberd2 的,不过它写的比较复杂,我自己重新做了一个简化版,函数名还保留用了它的.
...有8个字节,而且只存储到日期,如果你要求精度比较高可能就不合适。内部有一个自动转换的算法,如果你直接传入时间戳它也会智能转换成 8位的日期。 用 numeric 则可以很完整的记录到秒数。 建议你用 numeric 存时间戳...