建议支持词库里的词可以是纯英文单词,虽然在分词时英文单词可以自动识别切分开,但在关键词提取和非法词过滤时却无法提取出或过滤掉纯英文单词。 比如:我要从一些商品名中提取一些品牌:adidas nike。。。对商品名分词...
[size=6]强烈要求 老大 ,把 UTF8 的词库制作方法[/size] [size=6][/size] [size=6]或者 把 词库 GBK 转 UTF8 的方法贴 出来[/size] [size=6][/size] [size=6]不然老是不会用啊。。[/size]
早就对分词技术做过很多研究,但是却从没发现简单易用的产品,哪怕是收费的。 今天无意中发现了FTPHP的SCWS,安装试用了下,非常棒!关键MMD还是开源免费的,能够自定义各种功能。 强烈支持并持续关注!
...被当做标点符号清除。 现已更新词典,修正该问题,强烈建议重新下载新词典。下载地址: [URL]http://www.ftphp.com/scws/download.php#dict[/URL] 感谢网友 isS 的不断反馈。
...1.2.14,还有少量上美化和小功能增加,在此[color=#FF0000][b]强烈强烈地建议所有用户升级到这个最新稳定版!![/b][/color] 小提示,由于升级了 xapian-core,因此升级过程可能会稍显漫长,请不必担忧,耐心等候即可。 [b]主要更...
... BUG,并整合了最新的 xapian-1.2.12。现发布 1.3.2 正式版,强烈建议所有用户升级到这个最新稳定版本。 [b]主要更新如下:[/b] 1. 改进了已知的若干小 BUG 2. 升级整合最新的 [url=http://xapian.org]xapian-core-1.2.12[/url]、[url=http://www.ftphp....
...该版本主要是针对上一个版本的一些细节改进和BUG修正,强烈建议所有用户升级到这个最新版本。 其中有一个重要改进是针对搜索日志(用于热门搜索、相关搜索等),阻止一些废词进入搜索日志。如果您发现您的搜索项目...
...了许多用户诉求的 scws 分词接口,并修正了许多小 BUG,强烈建议所有用户升级到这个最新稳定版本。 [b]主要更新如下:[/b] 1. 增加基于搜索服务端的 XSTokenizerScws 便于直接使用 SCWS 的分词功能, 而不再需要额外安装其 php 扩...