这里的idf应该是会变化的吧。 我的意思是,在做全文搜索时,根据用户输入,拆分到词组, 拿这些词组在全文里搜索,这个时候,如果有词组对应的唯一ID,那么就可以通过id关联来查询,而不用like了。 如,一篇文章标题为:...
由于词库太大干扰所致,建议可以附加一个小词典(目的是删除这些无用词汇,以下我写出来作参考,把下面的文字存成dict.txt,然后在原有的set_dict之后加上 scws_add_dict(s, 'path/to/this_ad_dict.txt', SCWS_XDICT_TXT); 这样使文本词典生效. ...
unique id = table_name + id_in_table 将主键修改为 Table1_1 和 Table2_1 就好了呀 检索结果中提取 id 中 最后一个 _ 之前的部分就是 table 名了。
这个不能随便改,但可以通过调整源码的编译参数来改。通常不需要这么做啊,实在有必要时你们可以考虑继承XSTokenizerScws 来自己修改它。
[quote='hightman' pid='366' dateline='1324273957'] 字段多个值是什么意思呢? 这段值可以只有一个,但可以索引多个词汇。 比如你有一个字段叫 date 存的是 2011-11-07 那么你可以在索引的时候通过 $doc->addTerm('date', '2011'); $doc->addTerm('date', '...
[quote='hightman' pid='3251' dateline='1359526251'] 这个不能随便改,但可以通过调整源码的编译参数来改。通常不需要这么做啊,实在有必要时你们可以考虑继承XSTokenizerScws 来自己修改它。 [/quote] 感谢,我就是这么干的~
将分辨率数据转换成主表的一个字段,用 XSDocument::addTerm 添加索引或转换成特殊字段采用 split 分词器
如果是虚拟机很难有让自己添加DLL文件的虚拟式,自己的服务器就当然要用LINUX的了。
[quote='Elson' pid='373' dateline='1324370104'] [quote='hightman' pid='366' dateline='1324273957'] 字段多个值是什么意思呢? 这段值可以只有一个,但可以索引多个词汇。 比如你有一个字段叫 date 存的是 2011-11-07 那么你可以在索引的时候通过 ...
[quote='hightman' pid='5345' dateline='1386914552'] unique id = table_name + id_in_table 将主键修改为 Table1_1 和 Table2_1 就好了呀 检索结果中提取 id 中 最后一个 _ 之前的部分就是 table 名了。 [/quote] 是不是可以理解为,在项目设置中,增加一...