...在尝试将SCWS与一国外的开源搜索引擎结合…… 现在目前已经成功用SCWS替换其原本的分词代码。 但是却发现一个问题,就是SCWS的适用范围似乎特别的窄…… 对于一个页面来说,通常含有数字、英文、英文标点、中文标点、中...
如果是xunsearch搜索日志你不需要手动导入,它已经自动处理过了。 外部来的可以导,手册很明确指出搜索日志用于拼音建议、相关搜索。至于你所谓的精准度,似乎毫无关系
现在网页上下载的已经全部统一为GBK编码了,目前测试在MACOS下面不会乱码了。看抓图
这是由于 `` 反引号在 shell 中是特殊处理的,代表在命令执行,所以当 PHP 执行时已经被替换为命令结果了。 已在新代码的帮助说明中增加了标注,特别感谢楼主的提示。
我一直在研究怎么作一个合适的自动标签系统,国外已经有几个了,yahoo就提供了的,让你把文章发给它,它给你返回适合你文章的几个标签。 这对于帮助用户的文章归类很有意义,因为通常用户不能很好的自我归类。 我...
...上图可知,我们需要文章标题,文章内容,作者,时间,已经文章分类,同时,我们设定了可选的搜索条件:分类选择,时间选择,以及时间排序,只搜索标题等条件。 现在我们来设计一下项目需要的字段。 以下是伪代码,...
[quote='hightman' pid='3543' dateline='1273739877'] 下载包中的 scws-1.1.2.tar.bz2 或下载中的 rules.tgz 均为最新 [/quote] 已经更新了:D
已经不能下载了。像是附件被删除了。 [quote] file_get_contents(./uploads/201002/post_3247_1267257571_f109e5a779400611f87ed98953d00b54.attach) [function.file-get-contents]: failed to open stream: No such file or directory [/quote]
谢谢hightman的回复! 安装问题已于今日上午解决,也已经能够正常的被php加载上去了。 但是现在有个问题是 无法分词,情况是这样的: 1. 按照统计形式分词,返回结果为空 2. 而按照非统计形式分词,结果是单字,没有词组。 3...