早就对分词技术做过很多研究,但是却从没发现简单易用的产品,哪怕是收费的。 今天无意中发现了FTPHP的SCWS,安装试用了下,非常棒!关键MMD还是开源免费的,能够自定义各种功能。 强烈支持并持续关注!
楼主,为什么不能发新帖了啊。我用1.18 php_scws.dll(2) 对应的php版本为 5.2.3 完全按照文档目录 php_scws.dll/Win32 安装说明 这个上面做的。而且安装完扩展之后echo phpinfo();也看到了 scws服务已经有了。 在运行时加了 scws.default.charset...
...但实际结果是“有空 间” 即使通过scws_add_dict()添加了自定义的txt字典(里面只包含“空间 11.82 12.38”一行),仍然分不出“空间”这个词。 还有如何设置才能识别出网址和邮箱等格式? 另外关于scws-gen-dict,按照github上的...
...有提供scws的api接口,实现短语分词功能 2.是否可以对scws自定义中文词典,方便扩展
...提升了搜索服务的性能及稳定性,同时加入了项目级的自定义词库功能。强烈建议所有用户升级到这个最新稳定版本,以便发挥 xunsearch 的最大威力。 主要更新如下: 1. 升级整合最新的 xapian-1.2.13、scws-1.2.1 2. 新增支持项目...
...切换。 访问网址: > note: 在线编辑器暂时不支持指定自定义分词器和分词器参数,这个部分需要用户自行手动修改。 $Id$
...is->tokenizer !== XSTokenizer::DFL);} 判断当前字段是否采用自定义分词器
[quote='benq81' pid='1380' dateline='1351136388'] 我看楼主现在的搜索挺准确的啊,是自己加了分词吗?还是别的办法~ [/quote] 当时给他建议后添加了自定义词汇,药到病除。。。