[quote='hightman' pid='3251' dateline='1359526251'] 这个不能随便改,但可以通过调整源码的编译参数来改。通常不需要这么做啊,实在有必要时你们可以考虑继承XSTokenizerScws 来自己修改它。 [/quote] 感谢,我就是这么干的~
... -------------------------- XXX - - (表示错误或不需要的词,应删除)不需要的词指能自动识别了的。 XXX n c (原来标注为n 实际应该为 c) ---- 附北大词性标注版本 ---- Ag 形语素 形容词性语素。形容...
...是为何? 项目只要求对content字段检索,其他字段都不需要参与检索和分词。 帖出我的配置文件: [tweetId] type = id tokenizer = none [content] type = body cutlen = 600 [authorId] tokenizer = none [sendTime] tokenizer = none [source] tokenizer...
... public array getCorrectedQuery(string $query=NULL) $query string 需要展开的前缀, 可为拼音、英文、中文 {return} array 返回搜索词组成的数组 源码: sdk/php/lib/XSSearch.class.php#L795 (显示) public function getCorrectedQuery($query = null){ $ret =...
平滑重建索引 前一章讲到有些情况不得不需要重建索引,可以用 [XSIndex::clean] 立即全部清空所有数据, 然后再把现有数据全部添加到索引数据库中。 但这种方式的缺点对于线上项目是难以容忍的,因此可以选择使用...
...ightman' pid='4407' dateline='1375170632'] clone 出来先运行 gitprep 需要装好多工具,autoconf, automake, m4, aclocal, libtool [/quote] 多谢管理员回复,我后来直接运行了acprep,然后运行就有configure生成了,我就运行./configure,结果显示 configure: e...
...是-M3呀 [/quote] 如何设置成其他的值呀 最近的一个项目需要全部的单字 在项目的ini里,tokenizer = default 如果是3的话 不知到如何改成11 是否是使用xlen(1) 来设置?这个xlen对中文和英文如何计算长度? 请老大指教~
...c mixed convert(mixed $data, string $to, string $from) $data mixed 需要转换的数据, 支持 string 和 array, 数组会自动递归转换 $to string 转换后的字符集 $from string 转换前的字符集 {return} mixed 转换后的数据 源码: sdk/php/lib...
...tring 搜索语句, 若传入 null 使用默认语句 $limit int 需要返回的相关搜索数量上限, 默认为 6, 最大值为 20 {return} array 返回搜索词组成的数组 源码: sdk/php/lib/XSSearch.class.php#L707 (显示) public function getRelatedQuery($query = nu...
...含了智能检测功能。 > > 此外 `xunsearch` 的安装和运行都不需要 `root` 权限,强烈推荐单独设置一个系统用户用于安装 > 执行相关指令。 Xunsearch 全部开源,理论上也可以从官方提供的 [git 仓库][1] 获取源码自行构建,但是 这要求...