嗯。词库我看到了,我是想在这个基础上做加入一些新的自己的就可以,您的这个支持,动态词库吗? 还有请问哪里能下载到,你的词库原文件。没编译过的。[hr] 我看到scws的代码都集成到xapian的queryparser中了,我想直接加入新...
目前没有方法,我看只有采集 http://www.ftphp.com/scws/demo/get_tfidf.php 这个地址。 希望可以共享一下
...用文档写明白、傻瓜一点。 我看完了几个文档就没看懂怎么用,可能是我愚笨。不过我看好像不光我一人不知道怎么用。 scws-0.0.1在linux系统下怎么用。 下载之后,怎么编译,一步一步的,希望版主能热心一点,谢谢。
同样问题: 新建的词典如何设置权重 比如:相宜本草 (某化妆品品牌) 被分成: 相宜 本草 我通过词典增加的 “相宜本草” 但是不管用 mydict.txt 文件内容如下: 1 相宜本草 2 雅漾 3 舒护 4 活泉水 # scws -A ...
数据源也导入成功了 下是项目ini配置 project.name = study project.default_charset = utf8 server.index =8383 server.search =8384 [user_id] type = id [username] index = self tokenizer = full [password] index = both [email] index = both 后来自己又写了个php...
...览器打开,却成了UTF-8的编码了,显示出乱码了! 不管怎么去设置,每次打开,都成UTF8的,按理说,我的GBK编码的文件,浏览器里应该是也是GBK的,但是却成了UTF8的了 所以我认为分词不正确的,也许是这个问题,但是我不知...
的时间成这样子的了,怎么让他变成原来的纯数字的。 我存到mysql数据库里的时间用的是 time(); 获得的。存到索引里成 “1.27883e+09”这样子了,怎么能变回去。或者怎么用date(); 函数格式化?
[quote='hightman' pid='7103' dateline='1319824645'] 你要用自定义词库 编写一个 dict_extra.txt 里面写上每个词,一个一行 然后调用 add_dict 加入词典 [/quote] 您好,用自定义词库是可以解决但却不是太方便,如果SCWS不能这样的配置,...
后来查看进程,发现stop后还有xunsearch进程在运行,kill之,然后重启搞定。 后来查明原因是因为用bin/xs-ctl.sh -b inet start 启动,但关闭时用的bin/xs-ctl.sh restart ,这个的话就会出现上面描述的问题了。 其实就是用bin/xs-ctl.sh -b in...