搜索

大约有 60 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0061秒)

21.疑惑:分词数上限和标点符号控制

发布时间:2013-05-10 17:05 t By Brady.Li

....dll (1.2.1) ,php扩展 其一: strpos($w['word'],"5) 参数limit,设置分词数上限,可否不控制上限?参数是什么 其二: set_ignore(bool yes) 参数:true的话,表示忽略标点,但是实测中好像' "这种标点是无法忽略的, 如在我使用中会...

22.RE: scws与多线程

发布时间:2010-12-08 14:12 t By hightman

...切分建议各自用一个 mode ,除非你自己能确定它们的切词设置是共用的(主要用于保存切词中那些是否忽略符号,是否复合分词等的设置

23.“有空间”的分词有问题和扩充词典

更新时间:2013-05-18 14:05 t By lyjkensou

...12.38”一行),仍然分不出“空间”这个词。 还有如何设置才能识别出网址和邮箱等格式? 另外关于scws-gen-dict,按照github上的说明,可以进行.xdb到.txt转换,但是实际测试时显示没有-U这个选项,请问是取消了吗?如果是取...

24.RE: 搜索上的问题死活搜不到

发布时间:2013-07-19 09:07 t By tisswb

[quote='net_li' pid='4355' dateline='1374126126'] 没人给解答下吗? [/quote] 可以使用1.4.7测试版本,这样就可以设置分词的setMulti属性,设置成11就能把所有单字都分出来,但是这样数据文件会变大,个人权衡效率问题吧

25.RE: 实时加载字典,服务器严重吃不消,有没有办法?

发布时间:2009-08-06 00:08 t By hightman

...的. [/quote] 安装了apache扩展,使用PHP进行调用,也可以设置读入内存? 如果可以的话,每次分词还要设置词典么? [/quote] 这个要的, 仅仅对当前的那个 scws handler 有效, PHP程序一结束资源全部释放了

26.Hightman您好,我的分词怎么不对啊

发布时间:2010-08-18 21:08 t By assad

终于编译了,也设置成功,字典位置也很正确,可是分词却不对!! No. WordString Attr Weight(times) ------------------------------------------------- 01. 权利 nr 7.00(2) 02. 陈凯歌 nr 3.50(1) 03. 包括导 ...

27.RE: Hightman您好,我的分词怎么不对啊

更新时间:2010-08-19 15:08 t By assad

...开,却成了UTF-8的编码了,显示出乱码了! 不管怎么去设置,每次打开,都成UTF8的,按理说,我的GBK编码的文件,浏览器里应该是也是GBK的,但是却成了UTF8的了 所以我认为分词不正确的,也许是这个问题,但是我不知道为什...

28.怎么加载自定义字典

发布时间:2010-11-05 14:11 t By iranw

终于找到一个自动分词系统,由于不能确定服务器是否加载这个分词的dll文件 则使用PSCWS4进行使用 可是pscws4类中并没有add_dict函数 我用set_dict设置自己自定义字典.txt文件 一直报错 这个怎么解决 就是加载自定义的txt字典 thank u

29.分词初试,结果不对

发布时间:2010-09-06 10:09 t By xiaowang19

...~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 不知道我是哪里没有设置好,官方有没有注意事项,或更详尽的说明,谢谢

30.图片搜索的一些疑问

更新时间:2014-02-16 17:02 t By Mr.

...题标 非唯一 但每个图集题标都是唯一 type = title;我可以设置为string? index = both;如果type = title 请问我可以设置为self吗? tokenizer = default;默认scws分词器 cutlen = 0 weight = 5 phrase = no;关闭精确检索 non_bool = no;要实现默认的匹配度...

  • 时间不限
  • 按相关性排序