文档说明

搜索建议和纠错

这项功能也是建立在搜索日志的基础上。

1. 拼写纠错

对于英文,由于打字速度过快或各种原因都很容易造成一两个字母出错。对于中文来说,古代就动不动 出现同音”通假字“,绝大多数现代人也使用拼音输入法,加上方言口音,乱用同音字现象非常普遍。

所以系统在综合分析索引库内的词汇、用户搜索日志基础上建立了一个庞大的纠错体系,支持英文拼写 纠错、中文同音字纠错、拼音转换等。

使用这些功能都非常简单,直接调用 XSSearch::getCorrectedQuery 即可,该方法接受搜索语句 作为参数,如省略参数则直接使用最近一次 setQuery 的语句,返回值是修正词汇组成的数组,若 没有更合适的修正方案则返回空数组。

// 假设在本意是在 demo 项目中搜索 "测试",但不小心打成了 "侧试"
$search->setQuery('侧试');
$docs = $search->search();  
 
// 由于拼写错误,这种情况返回的数据量可能极少甚至没有,因此调用下面方法试图进行修正
$corrected = $search->getCorrectedQuery();
if (count($corrected) !== 0)
{
   // 有纠错建议,列出来看看;此情况就会得到 "测试" 这一建议
   echo "您是不是要找:\n";
   foreach ($corrected as $word)
   {
      echo $word . "\n";
   }
}
 
/** 
 * 以下拼写示例则简化,并直接传入 Query 语句进行测试 
 * 您也可以例句用 `util/Quest.php demo --correct <word>` 进行测试
 */
 
$search->getCorrectedQuery('cs');  // 通过声母缩写得到建议: "测试"
$search->getCorrectedQuery('ceshi');  // 通过全拼缩写得到建议: "测试"
$search->getCorrectedQuery('yunsearch'); // 通过拼写纠错得到: xunsearch
$search->getCorrectedQuery('xunseach 侧试'); // 混合纠错得到: xunsearch测试

Tip: 建议在搜索结果数量过少或没有时再尝试进行拼写纠错,而不是每次搜索都进行。

2. 搜索建议

搜索建议是指类似百度那样,当用户在搜索框输入少量的字、拼音、声母时提示用户一些相关的 热门关键词列表下拉框供用户选择。

这样做非常有利于节省用户的打字时间、提升用户体验。

我们通过 XSSearch::getExpandedQuery 来读取展开的搜索词,该方法返回展开的搜索词组成的 数组,如果没有任何可用词则返回空数组。接受 2 个参数:

  • $query 要展开的搜索词,返回结果是以这个搜索词为前缀、拼音前缀展开,此为必要参数
  • $limit 整数值,设置要返回的词数量上限,默认为 10,最大值为 20
/**
 * 以下例子也可以用 `util/Quest.php demo --suggest <word>` 进行测试
 */
$search->getExpandedQuery('x'); // 返回:项目, xunsearch, 行为, 项目测试
$search->getExpandedQuery('xm'); // 返回:项目, 项目测试
$search->getExpandedQuery(''); // 返回:项目, 项目测试
$search->getExpandedQuery('项目'); // 返回:项目测试

Tip: 实际使用过程中,搜索建议通常单独设计一个入口脚本,再在主搜索界面的搜索框中通过 ajax、AutoCompleteJavaScript 技术来根据用户的输入动态载入建议词列表。

$Id$

留下一条评论吧!

请到论坛 登录 后刷新本页面!