...、返回这么简单了,用户体验要求也高起来了。 布尔搜索、关键词联想、拼写纠错、拼音搜索、同义词、排序都不容忽视。目前我们正在潜心制作的一个新产品 xungle,基于 scws分词,是一个全文检索的服务项目,效果还是非...
...L 表结构 ---------------------------- 由于我们只是对贴子进行搜索,所以只需要关心它的贴子表即可,表结构如下: ~~~ [sql] -- -- 表的结构 `cdb_posts` -- CREATE TABLE `cdb_posts` ( `pid` int(10) unsigned NOT NULL auto_increment, `fid` smallint(6) unsigned...
...版本在内存使用、IO等方面做了较大的改进,大幅提升了搜索服务的性能及稳定性,同时加入了项目级的自定义词库功能。强烈建议所有用户升级到这个最新稳定版本,以便发挥 xunsearch 的最大威力。 主要更新如下: 1. 升级...
支持多表搜索吗,以前用的是迅狗,后来用的织梦分词,最近刚发现有这个了,想试试。
我一直在研究怎么作一个合适的自动标签系统,国外已经有几个了,yahoo就提供了的,让你把文章发给它,它给你返回适合你文章的几个标签。 这对于帮助用户的文章归类很有意义,因为通常用户不能很好的自我归类。 我...
我觉得scws的分词不错,但是xunsearch的搜索不是很符合我的要求, 我主要是数据库索引加搜索方面的,所以xs的索引建立是一大问题,看了一下貌似sphinx在这方面比较好,网上也看到过这样的案例,用sphinx+scws建立索引加分词,...
[php] [root@localhost bin]# ./php /usr/local/lamp/xunsearch/sdk/php/util/Quest.php demo 很有 在 3 条数据中,大约有 0 条包含 很有 ,第 0-0 条,用时:0.0022 秒。 [root@localhost bin]# 有意思 -bash: 有意思: command not found [root@localhost bin]# ./php /usr/local/l...
...测试大概准确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、关键字提取等场合运用。 切词效率测试(UTF-8编码,随机从天涯抓取了一个连载页面测试结果, 45Kb左右的文本切词时间是0.026秒, 换算完毕大概是 1.5MB文本/秒) 测试...