搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2928秒)

101.「清除标点符号断词」错误回报

发布时间:2010-05-16 21:05 t By pudding

...让我感到非常地钦佩。 我安装了SCWS-1.1.2的PHP扩展,并使用「清除标点符号」来进行断词时,发现连非标点符号的字都被省略掉了。 在线演示的网页中也有一样的情况: http://www.ftphp.com/scws/demo/v48.cht.php 输入「館藏選擇與...

102.从windows迁移到linux发生的问题

发布时间:2013-12-07 14:12 t By favii

原先使用windows版本,现迁移到ubuntu 64位系统,下载安装了最新版scws,安装过程还算顺利。 测试时发现以下怪现象: 本人使用15000个左右的学校名称做分词测试,约1400条记录返回空白,其它则貌似正常,不知何故。 比如:北...

103.RE: [2012] SCWS-1.2.0 发布,BSD协议、支持自定义词库、PHP5.4

发布时间:2012-05-03 20:05 t By ttff

版主您好,我在自定义词表里加了一些数字+字母的词,如pm2.5,101大楼这样。 使用的时候发现无法正常分出来,我看到新版是加了一些强制拆分的功能,但是对自定义词表里的词,也是强制拆分的码?

104.xunsearch-1.4.1 (xapian+scws 开源搜索引擎,修正搜索进程死锁)

发布时间:2013-02-21 11:02 t By hightman

...发布 xunsearch-1.4.1 正式版,1.4.x 对比以前的 1.3.x 版在内存使用、IO等方面做了较大的改进,大幅提升了搜索服务的性能及稳定性可靠性,同时加入了项目级的自定义词库功能。强烈建议所有用户升级到这个最新稳定版本,以便发...

105.php5指定字典出错

发布时间:2007-12-13 12:12 t By cnzaicom

...性 交 了 一 百元 买 了 一次性 杯子 50 打 上面这句成功使用默认字典 下面自定义字典出错。 系统:apache php5 [b]Warning[/b]: scws_set_dict() [[color=#0000ff]function.scws-set-dict[/color]]: Failed to load the dict file in [b]D:\AppServ\www\rootwww\fc\test.php[...

106.libscws 段错误的 bug 修正

发布时间:2007-07-05 09:07 t By hightman

scws.c 中,由于取词时使用一个 unsigned char 来记录分词的长度,存在特殊情况即通过 rules.ini 自动识别出来的词有可能超过 255 字,如全部连续的双字节数字或字母.超过 255 字后 这里的 j 将变得不正确可能导致 item-> 指向 NULL ,...

107.xunsearch-1.4.0 (基于xapian+scws的开源中文搜索,大幅改进性能及稳定性)

发布时间:2013-01-22 12:01 t By hightman

...,很高兴于今天发布 xunsearch-1.4.0 正式版,该版本在内存使用、IO等方面做了较大的改进,大幅提升了搜索服务的性能及稳定性,同时加入了项目级的自定义词库功能。强烈建议所有用户升级到这个最新稳定版本,以便发挥 xunsear...

108.RE: 分词问题

更新时间:2010-10-14 21:10 t By hightman

...词先单字后多字,所以达不到“云“+”计算“的效果。 使用 txt 附加词典时请显式地先指定 xdb 词典,以便 txt 词典后生效。 $so->add_dict('dict.xdb', SCWS_XDICT_XDB); $so->add_dict('dict.txt', SCWS_XDICT_TXT); [color=red]$so->set_multi(3);[/color] .. 这样...

109.[2013] SCWS-1.2.2 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

...1.1.9 发布于 2011-12-26[/b] 2011-12-26: SCWS-1.1.9 Released. 1) 明确使用开源协议 New BSD License 发布新版本 2) 深度优化复合分词中的 SCWS_MULTISHORT 选项,更为合理有效,符合全文检索的需求 3) 测试脚本自动加载当前目录下的 dict_user.txt 文...

110.“有空间”的分词有问题和扩充词典

更新时间:2013-05-18 14:05 t By lyjkensou

使用的是scws-1.2.1 对“有空间”这个句子进行分词,理想的结果应该是“有空 空间” 但实际结果是“有空 间” 即使通过scws_add_dict()添加了自定义的txt字典(里面只包含“空间 11.82 12.38”一行),仍然分不出“空间”这个词。...

  • 时间不限
  • 按相关性排序