...篇,俗话说,无三不成礼,所以就有了第三篇,1314336168 搜索“测试”或“项目”可以,但搜索“测”、“项”或“二”、“MO”等词却得不到结果,这是为什么啊?
全文检索的单位通常是“词”。通常认为,一个普通的字没有意义。 实在有必要你可以自定义分词器,按字索引。
我有一个字段搜索时发现如果内容为
我就是这个商品。我很好搜索。
这种的话 用 我很好搜索 作为搜索字,会搜索不到结果。 如果内容为 我就是这个商品。我很好搜索。 这种的话 用 我很好搜索 作为搜索字,可以搜......题 * 2011-09-21 17:44:16 +0800 c6f835b hightman: PHP-SDK: 修正非UTF-8搜索语句预处理时正则修正 * 2011-09-21 12:35:38 +0800 a74630d hightman: PHP-SKD: 再次优化纠错、相关搜索语句净化算法 * 2011-09-21 11:45:55 +0800 4fbb329 hightman: PHP-SDK: 改进纠错、相关搜索...
...测试大概准确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、关键字提取等场合运用。 切词效率测试(UTF-8编码,随机从天涯抓取了一个连载页面测试结果, 45Kb左右的文本切词时间是0.026秒, 换算完毕大概是 1.5MB文本/秒) 测试...