TF就是词频率,也就是这个词在各种语料中出现的机率权重。(越经常出现的越高) IDF是逆词频率,也就是说这个词更重要(因为罕见一些);具体参见:http://baike.baidu.com/view/1228847.html 并没有很固定的算法,SCWS中的tf/idf均...
呃。我晕!xunsearch里面都是定义的各种数据源包括mysql或者csv之类的数据库表! 但是定义是按主键或者键名键值来定义搜索,我在想,能不能定义html的标签,来检索内容 否则的话,百度或者google是怎么去检索那些静态的网页或...
早就对分词技术做过很多研究,但是却从没发现简单易用的产品,哪怕是收费的。 今天无意中发现了FTPHP的SCWS,安装试用了下,非常棒!关键MMD还是开源免费的,能够自定义各种功能。 强烈支持并持续关注!
... 2. 按字段值的分面搜索功能,分面搜索现在非常流行于各种 WEB2.0 、电子商务等相关的站内搜索。 参见专项文档:[url]http://www.xunsearch.com/doc/php/guide/search.facet[/url] 3. 多字段联合排序功能,习惯了 SQL 的用户往往都会碰到多...
...下几种: full 表示本字段的值整体作为一个检索词,像各种 ID 都适合这种情况 none 表示本字段没有任何词汇用于索引 split([ ]) 表示根据参数分割内容,默认参数为空格,若参数以 / 开头并以 / 结尾则 内部调用 preg_split(arg, ....
...ure时加入 --with-php-config= .. 指定路径。 经常有的人由于各种原因在系统装上了多个版本的PHP
...码仓库:[url]http://github.com/hightman/xunsearch/[/url] 欢迎提出各种意见和改进建议。多谢!!!
...仓库:[url]http://github.com/hightman/xunsearch/[/url] 欢迎提出各种意见和改进建议。多谢!!!
...采用 xunsearch 定制开发自己的搜索引擎。本贴子长期收集各种经典案例,不论网站名气和流量,只看 xunsearch 开发效果好与坏。 其它用户的案例可以回贴告知我们,能附上网站简介说明更好,我们会不定期整理到顶楼贴子。 以...
...个最新稳定版本。 [b]主要更新如下:[/b] 1. 修正已知的各种小问题 2. 同步发布独立的 SDK 下载,并提供测试服务器,[url=http://bbs.xunsearch.com/showthread.php?tid=749]点击了解[/url]。 3. 添加 web 版的搜索配置文件编写工具,[url]http://www.xu...