需要增加一个新词“中国梦”。 使用的php XDB工具,增加词库后导入生成xdb文件。 重新生成coreseek的索引 索引的时候还是搜不出来这个词。 我确认使用的是utf-8 no-bom头的格式。 请问如何解决。谢谢
...如下的效果: 一/m 道/q 两/m 个/q 或者有其他解决从工具本身解决的办法 ------------------------------------ 我自己尝试调tf-idf都失败了,感觉这些词是被特殊处理的,没有按tf-idf来算? 因为量词太多,不可能一个个从词典用!删...
...件里面直接进行指定这个过滤器。 这样无论是通过管理工具,还是通过sdk 导入数据都可以默认掉用这个过滤器。 这样更便于整个项目的管理。 以后如果我想修改过滤规则,紧紧只需要修改一个文件就可以了
...件里面直接进行指定这个过滤器。 这样无论是通过管理工具,还是通过sdk 导入数据都可以默认掉用这个过滤器。 这样更便于整个项目的管理。 以后如果我想修改过滤规则,紧紧只需要修改一个文件就可以了
...存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持 PHP 语言。API 简单清晰,开发难度极低,提供全中文的示例代码、文档、辅助脚本工具等。 [b]全功能:[/b]除支持基础的自定义分词、字段检索、...
http://www.ftphp.com/scws/demo/v4.php 在这可以查分词结果 用附带的工具 util/Quest.php 加上 --show-query 可以看实际拆分的语句,这样你就明了了。
XDB不可轻易修改, 需要借助工具转换纯文本为xdb, 添加和修改词不太方便 还有二楼的代码是手册里的讲解,并不是要你抄进去. scws_get_tops() 返回的 attr 带有乱码是因为 windows 的 dll 较早所以才会有这样的BUG, 问题不大
导入数据是你自己通过API提交的,Indexer.php 只是一个工具帮你全部一次性导入,以后的数据你要自己再设法导入,或者直接用 Indexer.php 重建