2007年最新的 SCWS 第4版已于近日开发完成并测试运行中。它在算法与写法上都有相当大的改进,支持自定义规则的人名等专名自动识别,也支持UTF-8/GBK等不同字符集。经评估测试分词准确率在 95% 左右,召回率有 92% 以上。 这...
...] => 3 [idf] => 0 [attr] => r ) [1] => Array ( [word] => 是 [off] => 3 [len] => 3 [idf] => 0 [attr] => v ) [2] => Array ( [word] => 中国人 ...
.../data/www/xunsearch/bin/xs-ctl.sh /hom/bigxu/xu_restart.log > /dev/null 2>&1 & try_times=5 if [[ $1 == 'help' || $4'x' == 'x' ]] then echo "arg1 try:url,example http://www.xunsearch.com/site/search?q=demo " echo "arg2 res_content,example:RE (content of arg1 must include arg2) " ...
...-----------------+--------------------------------+ | PHP 版本 | 5.3.3-1ubu | XS(core) | PHP 5.2.0 或更高版本是必须的。 | | SPL 扩展 | OK | XS(core) | SPL 扩展用于自动加载和对象戏法 | | PCRE 扩展 | OK | XSDocument, XSS...
...使用, 也感谢大量网友的不断支持. 目前 scws 的版本为 1.0.0 Release , 该版本稳定可用,而且包含两个文本词典,和转化为 xdb 的工具, 词典编码为 gbk, 将 gbk 转换成 utf8 应该非常简单了, 这里不再细述, 详细情请下载整个软件包以后阅...
好象IP地址也分了.比如:192.168.0.1,结果是: No. WordString Attr Weight(times) ------------------------------------------------- 01. 192.168 en 4.86(1) 02. 0.1 en 2.75(1) http://www.163.com No. WordString A...
我现在有两台服务器 一台是x.x.x.160 一台是x.x.x.162 我把xunsearch安在了160上,后把1里面的 sdk整个文件夹copy一份到了2上面 然后进入2里面的 sdk/php/app/xx.ini配置一下 (1里面也是xx.ini 但是没有设置server.index和server.search) project.name = ...
[color=#696969] 1, CentOS Linux release 6.0 (Final) 测试成功 2, debian-6.0.2.1 测试成功 3, Centos 4.0 安装成功 4, Centos 5.0 安装成功 6, Ubuntu 9.10 \n \l 安装成功 7, Ubuntu 10.04 安装成功 8, Red Hat Enterprise Linux AS release 3 (Taroon) 测试成功 9, FreeBSD 6.0-RELEASE ...
...吸收了大量网友的反馈意见,很高兴于今天发布 Xunsearch 1.2.0 正式版。 这次修订主要是开发了一些新功能,同时修正了一些 BUG,强烈各位用户建议升级到该最新稳定版本。新增的主要功能如下: 1. 新增搜索日志管理工具 uti...
问题1:使用原生的词库对‘阿斯顿发斯蒂芬罗铭罗大大罗’这段话进行分词 其中结果为: 阿斯顿 阿斯 斯顿 阿 斯 顿 发 斯蒂芬 斯蒂 蒂芬 斯 蒂 芬 [b]罗铭罗 罗铭 铭罗[/b] 罗 铭 罗 大大 大 大 罗 [复合分词选项] 最短词 二...