从结果看应该是 scws_set_dict(s, "/usr/local/etc/dict_chs_gbk.xdb", SCWS_XDICT_MEM); 这句话出了问题, 也就是可能词典不正确. 但这个词典目前测试在64位系统下也是可以正常工作的, 检查一下词典的字节数是不是没有下载完整.
...的词,如果把25吨放入词库确实也能解决问题,只是现实中可能有5~1000吨,总不能一个一个都放进去,所以还是建议在算法上增加此功能比较理想
如果要生成相关文档 可能会有大量的搜索 这样子log_db就会迅速的增加 达到好几个G 如果有开关就好了 只让用户搜索的部分进入log_db 还有搜索词加上附加条件后 也有这样的需求 比如搜索词满足一定的长度(5-10个汉字)添加...
场景: 一个产品名称A,他可能有B、C、D三个别名。数据库中别名是存在另外一个数据表中的,有B、C、D三条记录,对应到产品A上。对于索引的话,我之前用的solr 它有个字段multiValued="true"支持。不知道迅搜怎么做?
可能是你的词被切成了其它不合理的单位吧. 加到special没有用. 你最好测试一下被检索的语句/文本切词后的效果...
我也有同样问题,有几种不太一样的数据形式,数据库中合成一个表的可能性不大,不过索引可以考虑合成到一个项目中。但是如何处理id主键呢?来自不同表的id值应该会引起冲突,是不是可以考虑为索引库单独生成一个uuid?
如图,已经过了很久了,还是不对。除了更新延时还有其他可能吗?[img]http://mon.d1505.com/mmcms/tt2.jpg[/img]
可能是你的加载路径不对吧,检查一下 php.ini extension_dir 的设置 如果加载运行 php -m开头会有一段错误消息