... ATTR 当机立断 14.01 8.10 i WORD ATTR我都能理解。 上贴说的逐字分词后 计算权重的时候使用IDF,貌似就是类似基于字典的最大概率方式来定义权重,或者说是对于歧义的取舍。 TF IDF 具体是指什么? 使用的概率计算公式能阐...
不是很明白,你说的自动分词??是什么意思 你在配置文件中不要指定 tokenizer 选项就会自动使用 SCWS 分词了。
支持是支持的,但数字字母最多只支持2位。 你说的情况其实切分成“斯巴鲁+WRX”并不会有多大问题吧。 像 Q币 QQ空间 这样的都是可以支持成词的。
每次更新都是期望改进,而不是倒退呵。 1.1.2 目前已经放入 [url]http://www.ftphp.com/scws/down/scws-1.1.2.tar.bz2[/url] 供下载。 您说的 1.1.2 在分词效果上比 1.1.8 还要好,可否指出哪几个实例 ?
感谢H大回复,好像是你说的这个问题。 曾经我以为这个scws是国外高人开发的,最近才发现国内的牛人。作为苦逼的程序一员,你就是我心中的刘德华了。
不明白你说的。同义词是基于分词后的结果制作的。 如果你的索引先前制作,后面再添加自定义词,那么当然无效了。你要重建索引
...标题和内容,可否提示一下其他特殊的字段怎么办?可以说的再详细一点点吗?:blush: [hr] [quote='hightman' pid='3781' dateline='1365406402'] 搜索框整合,甚至可以字段合并啊。想办法区分类型 [/quote] 又比如论坛和团购这样子,论坛的...
... dateline='1324274006'] 你的服务端连接有问题吧 先按我2楼说的办法设置了吗,此外更新到最新版先。 [/quote] [hr] 我也遇到这个问题 版本是最新的 超时也配置了 不过新新版本可以用重启解决 [quote='hightman' pid='462' dateline='1...