[quote='hightman' pid='255' dateline='1322196172'] 还是不明白! 你把这段文字用scws切割会有问题吗?如果你这段字是用空格或逗号分隔,那么你可以用 split 这个分词器啊。 搜索的时候搜索任何一个分割后的TAG都可以搜索到。 [/quote] ...
... zend_parse_parameters() -- [b]scws-1.1.2 发布于 2010-5-9[/b] 这是一个小bug修正版,修正在非内存模式词库时会导致人名识别失败的bug. -- [b]scws-1.1.1 发布于 2010-3-4[/b] 这是一个bug修正版,1.1.0 中存在内存泄露的重大bug。 -- [b]scws-1.1....
...自定义词库,$prefix/data/项目名称/dict_user.txt 加入H61,但是不起作用,中文词汇是可以的。如果想分词结果中有H61,是不是只能自定义分词了?像这种商品的型号中很多类似的,如华硕主板H87-PLUS,H61、H87分别代表不同的主板芯片...
... return $this;} 设置当前索引库的分词复合等级 复合等级是 scws 分词粒度控制的一个重要参数, 是长词细分处理依据, 默认为 3, 值范围 0~15 注意: 这个设置仅直对当前索引库有效, 多次调用设置值被覆盖仅最后那次设置有效, 而且...
..._t s; scws_res_t res, cur; char *text = "Hello, 我名字叫李那曲是一个中国人, 我有时买Q币来玩, 我还听说过C#语言"; if (!(s = scws_new())) { printf("error, can't init the scws_t!\n"); exit(-1); } scws_set_charset(s, "gbk"); scws_set_dict(s, "/usr/...
... 此举常用于需要大批量更新索引时, 此外重复调用本函数是无必要的
... if (mpath) free(mpath); if (npath) free(npath); 修改后应该是这样:[code]next_path: m = n + 1; } /* 一口.070808: memory leak fixed. */ if (mpath) free(mpath); if (npath) free(npath); }[/code]这里再次对hightman的工作和无私奉献表示...
...turn $this;} 设置当前搜索语句的分词复合等级 复合等级是 scws 分词粒度控制的一个重要参数, 是长词细分处理依据, 默认为 3, 值范围 0~15 注意: 这个设置仅直对本次搜索有效, 仅对设置之后的 setQuery 起作用, 由于 query 设计的方...
...据为好呢? 我现在 480W数据 单库 搜索速度非常慢。大概是2-4秒内。 就3个字段索引。 一个ID,标题,内容 有什么好建议吗
...细追查到问题代码,看来看去感觉都没问题, 更主要的是在 REDHAT,FREEBSD 上却都正确,后来试图把 MMAP 去掉居然都正确了,然后我就误以为是 DEBIAN上的 MMAP有问题。。。 汗~~