希望能附上完整的PHP代码以及你的自定义词库,以做分析和测试。 从上面少结果的看,应该是词库不生效,而结果只按人名规则合成了2个人名,其它的按无效字符过滤。
可以的啊,用SCWS_XDB工具导出成TXT格式就可以编辑了. 但要注意词性最多2个字符,不可以是#和@和!,这三个有特殊函义
[quote='hightman' pid='3535' dateline='1362724232'] 关掉高亮调用是否就不乱码? [/quote] 谢谢, 关闭高亮, 基本无乱码,偶尔字符截取,有一点 这个问题,我的在建索引前做转换了
现在要导入 7000W 数据 平均每条100个字符以下 发现10个小时才导入 1400W 感觉速度有点慢了 怎么样可以快点?