搜索

大约有 60 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0990秒)

11.RE: 集成包怎么自定义词库?

更新时间:2011-09-20 17:09 t By xjtdy888

嗯。词库我看到了,我是想在这个基础上做加入一些新的自己的就可以,您的这个支持,动态词库吗? 还有请问哪里能下载到,你的词库原文件。没编译过的。[hr] 我看到scws的代码都集成到xapian的queryparser中了,我想直接加入新...

12.RE: 冒昧的问一下——怎么tf和idf来计算权重?

发布时间:2012-05-21 16:05 t By markmx

目前没有方法,我看只有采集 http://www.ftphp.com/scws/demo/get_tfidf.php 这个地址。 希望可以共享一下

13.提个建议

发布时间:2008-01-02 21:01 t By freemanzk

...文档写明白、傻瓜一点。 我看完了几个文档就没看懂怎么,可能是我愚笨。不过我看好像不光我一人不知道怎么。 scws-0.0.1在linux系统下怎么。 下载之后,怎么编译,一步一步的,希望版主能热心一点,谢谢。

14.RE: 冒昧的问一下——怎么tf和idf来计算权重?

发布时间:2012-02-22 18:02 t By vanni

同样问题: 新建的词典如何设置权重 比如:相宜本草 (某化妆品品牌) 被分成: 相宜 本草 我通过词典增加的 “相宜本草” 但是不管 mydict.txt 文件内容如下: 1 相宜本草 2 雅漾 3 舒护 4 活泉水 # scws -A ...

15.骨架自动生成的search.php访问没有数据是怎么回事,管理员大哥帮帮忙

发布时间:2012-12-12 17:12 t By 刚接触xs

数据源也导入成功了 下是项目ini配置 project.name = study project.default_charset = utf8 server.index =8383 server.search =8384 [user_id] type = id [username] index = self tokenizer = full [password] index = both [email] index = both 后来自己又写了个php...

16.RE: Hightman您好,我的分词怎么不对啊

更新时间:2010-08-19 15:08 t By assad

...览器打开,却成了UTF-8的编码了,显示出乱码了! 不管怎么去设置,每次打开,都成UTF8的,按理说,我的GBK编码的文件,浏览器里应该是也是GBK的,但是却成了UTF8的了 所以我认为分词不正确的,也许是这个问题,但是我不知...

17.存到索引里的时间成这样子的了1.27883e+09,怎么让他变成原来的纯数字的

发布时间:2011-11-15 16:11 t By mengfanchao

的时间成这样子的了,怎么让他变成原来的纯数字的。 我存到mysql数据库里的时间的是 time(); 获得的。存到索引里成 “1.27883e+09”这样子了,怎么能变回去。或者怎么date(); 函数格式化?

18.RE: 10秒 10元 这样的想做为一个词要怎么配置

发布时间:2011-10-31 10:10 t By xjtdy888

[quote='hightman' pid='7103' dateline='1319824645'] 你要自定义词库 编写一个 dict_extra.txt 里面写上每个词,一个一行 然后调 add_dict 加入词典 [/quote] 您好,自定义词库是可以解决但却不是太方便,如果SCWS不能这样的配置,...

19.RE: 生成了索引库后,直接删除了索引文件,出现错误,怎么清空这个项目的所有数据

发布时间:2012-06-25 14:06 t By limingyao

后来查看进程,发现stop后还有xunsearch进程在运行,kill之,然后重启搞定。 后来查明原因是因为bin/xs-ctl.sh -b inet start 启动,但关闭时的bin/xs-ctl.sh restart ,这个的话就会出现上面描述的问题了。 其实就是bin/xs-ctl.sh -b in...

20.RE: 怎么分库才能优化好搜索性能?

发布时间:2011-11-09 00:11 t By hightman

C的SDK也有在规划,但主要定位给WEB,所以偏向于先开发脚本类的。

  • 时间不限
  • 按相关性排序