还是不明白! 你把这段文字用scws切割会有问题吗?如果你这段字是用空格或逗号分隔,那么你可以用 split 这个分词器啊。 搜索的时候搜索任何一个分割后的TAG都可以搜索到。
Freebsd 8.0-RELEASE 测试成功。如果碰到如下错误:configure:error: scws_new() NOT found in libscws, please check it first 请参考下面帖子:[url]http://bbs.xunsearch.com/showthread.php?tid=7[/url]
[quote='hightman' pid='255' dateline='1322196172'] 还是不明白! 你把这段文字用scws切割会有问题吗?如果你这段字是用空格或逗号分隔,那么你可以用 split 这个分词器啊。 搜索的时候搜索任何一个分割后的TAG都可以搜索到。 [/quote] ...
[quote='hightman' pid='251' dateline='1322149925'] 不是很明白,你说的自动分词??是什么意思 你在配置文件中不要指定 tokenizer 选项就会自动使用 SCWS 分词了。 [/quote] 嗯,可能描述不清。 我就是想有一段文字,然后根据这段文...
这个权重分配上 可以由参数定制化。 最基础的当然是共有标签,重复度,当然要剔除很基础的日常词汇,保留分类性的,这个不能简单由前10来实现,比如‘你好’被分词出来,而且频度很高,却不适合做标签的; 有些热门...
1, CentOS Linux release 6.0 (Final) 测试成功 2, debian-6.0.2.1 测试成功 3, Centos 4.0 安装成功 4, Centos 5.0 安装成功 6, Ubuntu 9.10 \n \l 安装成功 7, Ubuntu 10.04 安装成功 8, Red Hat Enterprise Linux AS release 3 (Taroon) 测试成功 9, FreeBSD 6.0-RELEASE 测试成功 10,F...
[quote='hightman' pid='255' dateline='1322196172'] 还是不明白! 你把这段文字用scws切割会有问题吗?如果你这段字是用空格或逗号分隔,那么你可以用 split 这个分词器啊。 搜索的时候搜索任何一个分割后的TAG都可以搜索到。 [/quote] ...
下一版本我编译一个吧。。。你试试下载 i386 版本的PHP呢
Warning: PHP Startup: Unable to load dynamic library 'd:/wamp/bin/php/php5.3.13/ext/php_scws.dll' - %1 不是有效的 Win32 应用程序。 apache的错误日志中这么报错!哪里有64位的扩展库下载?
...入TTL特性,就是说每条记录可以设置过期时间,过期后由系统自动回收。 为什么这么考虑: 1.xunsearch原理上是实现了别的数据库无法实现的全文检索功能,数据要靠定期加入或者清理,实际类似缓存系统。 2.靠操作去删除,...