搜索

大约有 56 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0054秒)

31.RE: 麻烦站长解释一下“透过scws_get_result()取数据时自行排除单个字”

发布时间:2010-08-22 00:08 t By hightman

返回的时候根据长度排除啊,GBK的话单字就是2字节,很好判断啊,UTF-8三字节,但也能判断出是不是一个单个的汉字

32.libscws 段错误的 bug 修正

发布时间:2007-07-05 09:07 t By hightman

... scws.c 中,由于取词时使用一个 unsigned char 来记录分词的长度,存在特殊情况即通过 rules.ini 自动识别出来的词有可能超过 255 字,如全部连续的双字节数字或字母.超过 255 字后 这里的 j 将变得不正确可能导致 item-> 指向 NULL , ...

33.配置文件的困惑

发布时间:2012-03-16 17:03 t By 张十三

...持正则或其它特殊字符分割 xlen([2]) 表示根据指定参数长度分段取词,如 ABCDEF => AB + CD + EF xstep([2]) 表示根据指定参数步长逐段取词,如 ABCDEF => AB + ABCD + ABCDEF 这里的none 和index下的none选项区别是??

34.XSServer::read

... 方法 protected string read(int $len) $len int 要读入的长度 {return} string 成功时返回读到的字符串 源码: sdk/php/lib/XSServer.class.php#L404 (显示) protected function read($len){ // quick return for zero size if ($len == 0) { return ''; ...

35.RE: SCWS 能否添加 “中文+英文”和“中文+数字”自定义词

发布时间:2012-08-30 20:08 t By xiaofeng

...,还是在源码里处理的? 如果要修改,使其支持更大长度的分词,该从哪里入手呢? 麻烦了!

36.RE: 麻烦站长解释一下“透过scws_get_result()取数据时自行排除单个字”

发布时间:2010-09-10 14:09 t By johnbaby

[quote='hightman' pid='3685' dateline='1282406611'] 返回的时候根据长度排除啊,GBK的话单字就是2字节,很好判断啊,UTF-8三字节,但也能判断出是不是一个单个的汉字 [/quote] 原来如此。明白了。非常感谢!

37.XSSearch::terms

... $query string 搜索语句, 若传入 null 使用默认语句, 最大长度为 80 字节 $convert bool 是否进行编码转换, 默认为 true {return} array 可用于高亮显示的词条列表 源码: sdk/php/lib/XSSearch.class.php#L515 (显示) public function terms($q...

38.RE: 请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)

更新时间:2013-01-28 15:01 t By tisswb

...是否是使用xlen(1) 来设置?这个xlen对中文和英文如何计算长度? 请老大指教~

39.PSCWS4使用问题

更新时间:2010-10-21 17:10 t By hnmazda

...8个左右就可以了,get_tops()能满足吗?能按匹配到的词的长度排序吗?再次感谢!

40.求救PSCWS4问题

发布时间:2010-07-21 10:07 t By FG2008

..., 包含: word 词本身, idf 逆词率(重), off 在text中的偏移, len 长度, attr 词性 // $text = "中国航天官员应邀到美国与太空总署官员开会"; $pscws->send_text($text); while ($some = $pscws->get_result()) { foreach ($some as $word) { echo $word['word'].'...

  • 时间不限
  • 按相关性排序