...让我感到非常地钦佩。 我安装了SCWS-1.1.2的PHP扩展,并使用「清除标点符号」来进行断词时,发现连非标点符号的字都被省略掉了。 在线演示的网页中也有一样的情况: http://www.ftphp.com/scws/demo/v48.cht.php 输入「館藏選擇與...
原先使用windows版本,现迁移到ubuntu 64位系统,下载安装了最新版scws,安装过程还算顺利。 测试时发现以下怪现象: 本人使用15000个左右的学校名称做分词测试,约1400条记录返回空白,其它则貌似正常,不知何故。 比如:北...
版主您好,我在自定义词表里加了一些数字+字母的词,如pm2.5,101大楼这样。 使用的时候发现无法正常分出来,我看到新版是加了一些强制拆分的功能,但是对自定义词表里的词,也是强制拆分的码?
...发布 xunsearch-1.4.1 正式版,1.4.x 对比以前的 1.3.x 版在内存使用、IO等方面做了较大的改进,大幅提升了搜索服务的性能及稳定性可靠性,同时加入了项目级的自定义词库功能。强烈建议所有用户升级到这个最新稳定版本,以便发...
...性 交 了 一 百元 买 了 一次性 杯子 50 打 上面这句成功使用默认字典 下面自定义字典出错。 系统:apache php5 [b]Warning[/b]: scws_set_dict() [[color=#0000ff]function.scws-set-dict[/color]]: Failed to load the dict file in [b]D:\AppServ\www\rootwww\fc\test.php[...
在 scws.c 中,由于取词时使用一个 unsigned char 来记录分词的长度,存在特殊情况即通过 rules.ini 自动识别出来的词有可能超过 255 字,如全部连续的双字节数字或字母.超过 255 字后 这里的 j 将变得不正确可能导致 item-> 指向 NULL ,...
...,很高兴于今天发布 xunsearch-1.4.0 正式版,该版本在内存使用、IO等方面做了较大的改进,大幅提升了搜索服务的性能及稳定性,同时加入了项目级的自定义词库功能。强烈建议所有用户升级到这个最新稳定版本,以便发挥 xunsear...
...词先单字后多字,所以达不到“云“+”计算“的效果。 使用 txt 附加词典时请显式地先指定 xdb 词典,以便 txt 词典后生效。 $so->add_dict('dict.xdb', SCWS_XDICT_XDB); $so->add_dict('dict.txt', SCWS_XDICT_TXT); [color=red]$so->set_multi(3);[/color] .. 这样...
...1.1.9 发布于 2011-12-26[/b] 2011-12-26: SCWS-1.1.9 Released. 1) 明确使用开源协议 New BSD License 发布新版本 2) 深度优化复合分词中的 SCWS_MULTISHORT 选项,更为合理有效,符合全文检索的需求 3) 测试脚本自动加载当前目录下的 dict_user.txt 文...
使用的是scws-1.2.1 对“有空间”这个句子进行分词,理想的结果应该是“有空 空间” 但实际结果是“有空 间” 即使通过scws_add_dict()添加了自定义的txt字典(里面只包含“空间 11.82 12.38”一行),仍然分不出“空间”这个词。...