... string 待分词的字段值(UTF-8编码) $doc XSDocument 当前相关的索引文档 {return} array 切好的词组成的数组 源码: sdk/php/lib/XSTokenizer.class.php#L33 (显示) public function getTokens($value, XSDocument $doc = null); 执行分词并返回词列...
...句, 若传入 null 使用默认语句 $limit int 需要返回的相关搜索数量上限, 默认为 6, 最大值为 20 {return} array 返回搜索词组成的数组 源码: sdk/php/lib/XSSearch.class.php#L707 (显示) public function getRelatedQuery($query = null, $limit = 6){ ...
...身就提供的功能,xunsearch 只是做了整合和规范。涉及的相关文件如下 (假设 $prefix 是您的安装目录) ~~~ $prefix/etc/dict_user.txt ~~~ 打开上述文件,文件开头已经有了相关注释和说明。这个文件就是自定义词库文件, 如果您同一...
...就需要用到一些专业英文单词分词。比如一篇文章是linux相关的我想让“linux”这个词优先被选出来,我在词典里加了linux 可是由于在文章中linux的出现频率低,就不能被分出来反而一些不需要的词例如var char什么的都被分了出来...
relatedQuery 属性 只读 public array getRelatedQuery(string $query=NULL, int $limit=6) 获取相关搜索词列表
...测试工具 `Quest` 是搜索测试工具,提供了搜索相关的各项功能,非常适合用于前期测试比较和纠错。 运行脚本工具的 --help 选项可查看内置的帮助和说明,如乱码可在选项后加入 -c gbk 试试。 ~~~ $prefix/sdk/php/util/Quest.php...
...用户在搜索框输入少量的字、拼音、声母时提示用户一些相关的 热门关键词列表下拉框供用户选择。 这样做非常有利于节省用户的打字时间、提升用户体验。 我们通过 [XSSearch::getExpandedQuery] 来读取展开的搜索词,该方法返回...
...搜索拥有"味道恶心"这个词的文章,(我的文档库里面是有相关文章的了)搜索的时候出现了大多都是分成了"XX味道"+"XX恶心"的,所以我就在自定义词库"etc/dict_user.txt"里面加入了一行 味道恶心 12.07 12.38 n 来把该词变成一个...
好长时间不写C了,写着有点吃力,所以暂时先把最基本需要的分词及高频词提取写出来了。 后续等有点空时会慢慢实现更多的功能及加入相关脚本。