...我想根据article_category的内容对article做分面搜索[/quote] 可以有两种实现方式: 1、使用XSDocument::addTerm 2、弄一个字段存放以|号分隔的多个article_category.id,把这个字段tokenizer 设为 split(|) [size=large][color=#FF0000]请问: 如果我删...
...码,看示例如下一句,scws_set_dict(s, "dict.xdb", SCWS_XDICT_XDB);可以run起来,但这种scws_set_dict(s, "dict.xdb", SCWS_XDICT_MEM);就不知在那里死了,run后没反应了? XDB模式是把词库.xdb缓存在mem中的吗? MEM格式是怎么样的策略? 另外,是否有...
...,像H大这样做更好。 [/quote] 结构相似的网页的话,也可以做单机程序,或者bat的文件去处理,但是没办法做到H大这样的,增量索引的功能
...传入时间戳它也会智能转换成 8位的日期。 用 numeric 则可以很完整的记录到秒数。 建议你用 numeric 存时间戳。
IP可能是被当做数字了,这个问题我想我得好好考虑一下呵。 数字可以允许一个点出现,所以出现了这样的情况,
...文里搜索,这个时候,如果有词组对应的唯一ID,那么就可以通过id关联来查询,而不用like了。 如,一篇文章标题为:我是中国人,假设该文章id为1 分词后,有'中国',‘中国人’,如果每个分词有唯一的id对应,假设‘中国’=...
...一起作为路径,你说该怎么设? 此外 $so = scws_new 怎么可以再用 scws_set_dict 呢?应该用 $so->set_dict(), 类运用和函数运用不要混合着乱用!!多看帮助说明上的例子,不懂不要改先就照抄。
[quote='hightman' pid='121' dateline='1319514186'] Indexer.php 你可以在 sql 语句中指定 offset 和 limit --sql="select * from cdb_posts limit 999999999999 offset 5000000" 类似这样,OFFSET 不能单用必须配合 limit [/quote] 呵呵 原来如此 非常感谢,数据已经导...
重启后不应该还会提示 rebuilding 你可以 ps 看一下是不是重启成功了 试试先 bin/xs-ctl.sh fastrestart
...scws对于中英文分词效果不是很好,即文中的中文分得还可以,但对于页面中的英文部分,包括email,url,host这类处理效果比较差,我们目前采用两个分析器配合使用来达到最好的效果,要是scws能处理得了像email,host,url和tag之类的分...