你这个应该是指SDK吧,目前我们暂时不会出。 如果有既懂PHP又懂JAVA的,应该很容易可以把 PHP 的SDK改为 java
如果只要文章中有Linux出现就算是Linux相关文章的话,其实是不需要分词了,直接用全文搜索Linux就好了。 只是SCWS目前看前来它的自定义词典不支持超过3个字,如果可以的话,可以通过自定义“Linux优化”来指定分词
...典库的功能。这样更加方便,就是不知道难度如何。因为目前我的词库可能每天都有新的加进去。 PS:我是个有洁癖的代码工人:D:D:D
...了啊?比如直接加进dict.utf8.xdb'?而不是这种方式 因为目前的词库比较大。用txt的话怕影响速度或性能一类的
HM,您好,我目前使用自定义词库实现分词,但是通过scws_get_top5()方法获取数据的时候(字母+数字大于等于3个的时候也会返回)。求过滤方案。 $sh = scws_open(); scws_set_charset($sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_...
...l=http://www.hightman.cn/demo/scws/v48.php]UTF-8版[/url](词库较旧) 目前全部使用 *Unix* 系统下的标准C开发,全部采用自行设计的词典格式 (XTree 和 XDB) 完全不需要依赖任何第三方库及数据库系统。统一编译成链接库 (.a或.so形式),在开...
...单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持 PHP 语言。API 简单清晰,开发难度极低,提供全中文的示例代码、文档、辅助脚本工具等。 [b]全功能:[/b]除支持基础的自定义分词、字段检索、布尔搜索外,...
在xunsearch缓存仅仅用于缓存ini文件,所以基本上不需要用到memcached这样重型需要TCP连接的开销。 因为一台服务器上你也不会开多少个搜索项目啊,就算没有缓存问题也不大。 目前自动支持apc\eacc\xcache