想把sogou的一些细胞词库整合到SCWS的词库里,要添加的词很多,不太可能用你提供的WEB查询工具一个个的去查找,怎么设置TF/IDF的值?
第4个测试版继续发布,修正了一些 LINUX 平台的安装兼容性,并内置了旧版 LINUX 不含的 libuuid 的问题。 别看日志很少,其实改动了很多文件 下载地址:[url]http://www.xunsearch.com/download/xunsearch-full-latest.tar.bz2[/url] 代码仓库:[ur...
具体如下,比如用t进行查询,都是重复1164715这个主键,如下,难道要在索引之前自己排重? ----------------------- 在 667,495 条数据中,大约有 1823 条包含 t ,第 1-10 条,用时:0.4005 秒。 1. OPI保湿底油+护理亮油(T10+T30) #1164715# ...
经过较长一段时间的维护和改进,目前 xunsearch 运行较为稳定。今天很高兴发布 1.3.1 正式版,在 SDK 层面加入了许多用户诉求的 scws 分词接口,并修正了许多小 BUG,强烈建议所有用户升级到这个最新稳定版本。 [b]主要更新如...
前台搜索无响应 查看后台searchd.log,一分钟出现N次的IO timeout 温柔重启无果,kill -9后重启 之后是N分钟出现一次的IO timeout提示了,频率大大降低了 是vps性能低的关系吗? ============================...
我解壓了 scws-dict-cht-utf8 ,發現大量 (7974個) 詞都給予了詞性un 對比 scws-dict-chs-utf8 (0個詞性un),這是技術問題嗎?