这里的idf应该是会变化的吧。 我的意思是,在做全文搜索时,根据用户输入,拆分到词组, 拿这些词组在全文里搜索,这个时候,如果有词组对应的唯一ID,那么就可以通过id关联来查询,而不用like了。 如,一篇文章标题为:...
[quote='hightman' pid='3622' dateline='1278485881'] 目前没有这个内置选项,建议在透过scws_get_result()取数据时自行排除... [/quote] 建议在透过scws_get_result()取数据时自行排除... 不是很理解啊。麻烦站长解释一下啊。
由于词库太大干扰所致,建议可以附加一个小词典(目的是删除这些无用词汇,以下我写出来作参考,把下面的文字存成dict.txt,然后在原有的set_dict之后加上 scws_add_dict(s, 'path/to/this_ad_dict.txt', SCWS_XDICT_TXT); 这样使文本词典生效. ...
...本的词库增加了词性标注,这对我很有帮助。想请教一下如何把0.0.1-pre版本的dict.xdb转换成txt呢?我找到了您发布的scws-v23里面的mk_txt.php,但是好像和新版本的xdb词库不兼容,能否麻烦提供一个txt格式的词库下载?多谢指教。 ...
...inyin:ff 可查找到 “强者风范” 。 我遇到的问题是: 1、如何查找类型为电影、并且拼音中包含ff的。如用:util/Quest.php words "pinyin:ff AND type:电影",怎么查不到结果? 2、如何根据 ff 把搜索到的影片中的关键词(芬芳、非凡、风...
本来按照Hightman的说明。我的文件放置的结构是这样的: “etc”:放置“自定义词典” 我的网站的目录结构是这样: [code]www【根目录】 |---mySite【子目录】 |---include【子目录】 |---使用分词功能的页面.php...
一个不懂分词的小白~ 想问下 我用迅搜 如何设定一些词 使得这些词不被scws进行分词 比如 “米兔车贴” 这个词, 被分词成 “米兔车 贴” 我该如何操作,才能使得这个词不被分开 我看到有用户自定义词典 dict_user.txt 我在...