因为没有人明白你说的意思。你说用官方的词典,可以分出“内衣”和保暖内衣“,这点我就非常不解了,按照我的理解,依照scws的分词策略,要么就分成”保暖+内衣“,要么就是”保暖内衣“,怎么会有”内衣“和”保暖内...
...是他的MYSQL没有安装字符集转换。 此外你的乱码是不是因为你的终端是 GBK 的?请尝试用 util/Quest.php 进行测试吧 util/Quest.php -p entry 小雪 如果乱码就加上 -c gbk 试试
... 0 条包含 1 ,第 0-0 条,用时:0.0013 秒。 [/quote] 我想是因为我设置的是默认的字符串的问题吧 字符串对数字的搜索不太好啊
楼上你的情况是因为你对API使用不正确, scws_get_result 应该循环调用 while ($words = scws_get_result($sh)) { foreach ($words as $word) { print_r($word); } } 此外, 繁体词库很不完善, 缺词太多而且有一些词也不正确
...的几个标签。 这对于帮助用户的文章归类很有意义,因为通常用户不能很好的自我归类。 我想XUNSEARCH是否可以实现, 文章发过来的,自动分词的基础上,得出最适合本文的标签。 这里可以按照权重来给标签来个排序,...
无效过滤器是不是因为你没把文件放到 sdk/php/lib/ 目录?还有你命令行指定的过滤器也注意大小写。
...attr_en : attr_un); 2. 百分号这个暂时 scws 还没有办法处理,因为 % 号被当作普通符号粗分时就断开了,不过可以在粗分阶段就强制处理,希望 scws 的下一个版本提供这个功能,如果有兴趣自己可以试试 hack 一下,应该可以通过修改...