在linux下装了scws1.1.2,并且装了php5的扩展,但是发现在分词时对于较长的字符串会自动截取前多少个字符进行切分,不知这是不是一个BUG?
请仔细看说明,$so->get_result() 并不是一次调用,需要多次调用直到返回FALSE 例子1. 使用类方法分词
...。我再描述一下,打个比方,我要切分一段有200个汉字的字符串,但是返回的分词数组只包含了前100个汉字的词。[hr] 我还是把代码贴出来吧。 从返回的分词数组可以看出来,语句的后半句“从下油到火候,从调料到配菜...
...为 default 采用内置的功能强大的 scws 分词,适合绝大多数字符串字段。也可以指定自定义分词器,格式为 name 或 name(arg) 两种形式,其中 name 是分词器名称,arg 则是传递给分词器构造函数的参数。自定义分词器需要在 lib/ 目录下...
...ws/etc/rules_cht.utf8.ini'); // 分词调用 send_text() 将待分词的字符串传入, 紧接着循环调用 get_result() 方法取回一系列分好的词 // 直到 get_result() 返回 false 为止 // 返回的词是一个关联数组, 包含: word 词本身, idf 逆词率(重), off 在text...
...09-15 14:22:37 +0800 4526e12 hightman: PHP-SDK: 修正 XS 对象解析 ini 字符串时得不到默认项目名的问题 * 2011-09-15 14:12:11 +0800 aab446f hightman: 给 markdown 格式的 README 加上 .md 后缀 * 2011-09-15 11:13:23 +0800 2fe76cf hightman: PHP-SDK: 修正搜索语句中处理 ...
...段文本的长度。该函数可安全用于二进制数据,不会因为字符串中包括 \0 而停止切分。这个函数应该在 scws_get_result 和 scws_get_tops 之前调用。 [b]返回值:[/b]无 [b]错误:[/b]无。 [b]注:[/b]scws结构内部维护着该字符串的指针和相...