我的搜索是要做成在一个表里不同的几个屏道,每个屏道下面的几十个子栏目,我的是dedecms系统;每个屏道做成一个搜索项,不知道什么把同一张表导成不同的索引。
为什么我对一串utf-8编码的中文分词,竟得到了下面的效果(只是单纯得到每个字) 我在程序里已经设置了编码方式 scws_set_charset(s, "utf-8"); [attach]124[/attach]
[quote='hightman' pid='1601' dateline='1354503505'] 不知指什么。你是分成多个搜索项目了吗? [/quote] 是的 全站有多个频道 每个频道是一个.ini的配置文件
...o non_bool = no [title];图片属于哪个图集的题标 非唯一 但每个图集题标都是唯一 type = title;我可以设置为string? index = both;如果type = title 请问我可以设置为self吗? tokenizer = default;默认scws分词器 cutlen = 0 weight = 5 phrase = no;关闭...
每个线程需要单独的SCWS实例 ,词典和规则集倒是可以共用的,主线程正常操作,其它线程可以在 scws 创建后通过 thread_scws->d = main_scws->d; thread_scws_r = main_scws->r; 来共用它们,因为词典和规则集都是只读而且各API都是线程安全...
奇怪你这个问题我这不能复现。 我完全复制了你的代码,执行若干次结果仍然是正确的,返回三个词,每个的次数均为 1 [attachment=37] [attachment=38]
我以前问过,不能单独更新特定字段的。只能全部更新,因为你ini文件里边都设置好了每个域的。 不过要是能只更新某个字段的话就非常好了,