搜索

大约有 546 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1002秒)

491.加载字典出现乱码 pscws3

发布时间:2010-09-16 16:09 t By chenhu5200

.../pscws3/pscws3.class.php'); $dict = './pscws3/dict/dict.xdb'; // 建立分词类对像, 参数为词典路径 $pscws = new PSCWS3(); $ignore = $autodis = true; $debug = $stats = false; $pscws->set_ignore_mark($ignore); $pscws->set_autodis($autodis); $pscws->set_debug($debug); $pscw...

492.scws-1.1.6 发布

更新时间:2011-04-20 15:04 t By hightman

...词之间时视为同一词而不再强行切开,此时如果激活复合分词的 DUALITY 选项,则仍能将符号切开作为复合词。 4.修正浮点数的识别规则,避免将IPv4地址识别为2个小数的尴尬,比如 192.168.1.1 以前会被切成 192.168 和1.1 2个数字,现...

493.RE: SCWS 能否添加 “中文+英文”和“中文+数字”自定义词

发布时间:2012-08-30 20:08 t By xiaofeng

...在源码里处理的? 如果要修改,使其支持更大长度的分词,该从哪里入手呢? 麻烦了!

494.XSTokenizerXlen

...1.0.0 源代码 sdk/php/lib/XSTokenizer.class.php 内置的定长分词器 Public 方法 隐去继承来的方法 名称描述定义于 __construct() XSTokenizerXlen getTokens() XSTokenizerXlen 方法明细 __construct() 方法 public vo...

495.XSTokenizerXstep

...1.0.0 源代码 sdk/php/lib/XSTokenizer.class.php 内置的步长分词器 Public 方法 隐去继承来的方法 名称描述定义于 __construct() XSTokenizerXstep getTokens() XSTokenizerXstep 方法明细 __construct() 方法 public ...

496.自定义词库怎么控制(字母+数字)组合的个数

发布时间:2012-08-27 16:08 t By kill-all999

我目前使用自定义词库实现分词,但是通过scws_get_top5()方法获取数据的时候(字母+数字大于等于3个的时候也会返回)。求过滤方案。 $sh = scws_open(); scws_set_charset($sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_set_rule($sh, './r...

497.hightman你好,请问有没有好的相关度算法推荐下?

发布时间:2008-04-03 15:04 t By routerpipe

你好,您的分词插件很好,但有个问题,我用这个插件做的相关度插件,实践中相关度并不大。 例如“你给我买的衣服“ match "你看的书" 和"一件衣服" 代码匹配出来相关度最大的是"你看的书",因为有2个词相同,而按照我...

498.RE: [预告] xunsearch 下一主版本 1.3.x 主要新增功能

发布时间:2012-01-04 12:01 t By hightman

...不是这个意思,你说的用 setFuzzy() 就可以实现。 因为分词的关系,有些长词其实可以细分为短词。 比如当一篇文章中包含“管理制度”的时候,它被分为“管理制度”“管理”“制度”三个词,无论搜索这三个词中的某一个...

499.RE: iis+php5.2.X下配置utf8的scws的问题

发布时间:2011-03-03 23:03 t By hit

...ftphp网站上要求,在自己的服务器上配置SCWS,但始终无法分词。 我需要的是utf8编码的。 测试文件在gbk下好使,应该如何改成utf8格式的? 请教管理员,我该如何操作。 :huh: [/quote] 你要注意的是 一些文件里面的 编码设置

500.XSTokenizerScws::getTops

...getTops(string $text, string $limit=10, $xattr='') $text string 待分词的文本 $limit string 在返回结果的词性过滤, 多个词性之间用逗号分隔, 以~开头取反 如: 设为 n,v 表示只返回名词和动词; 设为 ~n,v 则表示返回名词和动词以外的其...

  • 时间不限
  • 按相关性排序