全文检索的单位通常是“词”。通常认为,一个普通的字没有意义。 实在有必要你可以自定义分词器,按字索引。
...nt 版本 1.0.0 源代码 sdk/php/lib/XSIndex.class.php XS 索引管理 添加/删除/修改索引数据 Public 属性 隐去继承来的属性 名称类型描述定义于 connString string 连接字符串 XSServer customDict string 获取自定...
...种 ID 都适合这种情况 none 表示本字段没有任何词汇用于索引 split([ ]) 表示根据参数分割内容,默认参数为空格,若参数以 / 开头并以 / 结尾则 内部调用 preg_split(arg, ..) 来分割取词,以支持正则或其它特殊字符分割 xlen([2]) ...
...需要经常频繁的进行分词操作就应该采用mem方式,比如搜索引擎的建索引时主要耗费的时间都花费在分词上,反正现在内存也便宜,而且词典不算太大。如果程序偶尔才需要分一下词,那就没必要load到内存里了。
搜索概述 在索引库建立完成后,现在开始学习使用搜索功能,这也是最核心的部分。 如何开始使用搜索? --------------- 在 `PHP-SDK` 中,搜索功能由类型为 [XSSearch] 的对象所维护。在 [XS] 项目中,通过读取 [XS::search] 属性...
...对我的需求来说,对于人物英文名以3个字母为单位建立索引的确可以达到很好的效果,中文名以一个汉字为单位。 最后贴出我的代码给有需要的人: [php] class XSTokenizerUnary implements XSTokenizer { private $length = 1; // 默认切分...
...索日志关键词到缓冲区里 XSSearch addWeight() 添加权重索引词 XSSearch close() 关闭连接 XSServer count() 估算搜索语句的匹配数据量 XSSearch execCommand() 执行服务端指令并获取返回值 XSServer getAllSynonyms() 获取当...
...需要经常频繁的进行分词操作就应该采用mem方式,比如搜索引擎的建索引时主要耗费的时间都花费在分词上,反正现在内存也便宜,而且词典不算太大。如果程序偶尔才需要分一下词,那就没必要load到内存里了。 [/quote] 恩,...
...看上去跟搜索结果也是有关系的,但 实际上这些可以在索引入库时进行处理和排除,完全没有必要放到搜索数据中去,所以不列入。 字段设计与分析 ------------- 得到字段后,进一步分析各个字段的用途与写法。 - `pid` 非常明...
...如有两个名字:San Zhang和randy hong,我按照这种方式建立索引后,查询:name:randy后,返回的第一条结果是San Zhang,第二条才是randy hong,很不解啊,同时这个方法也不支持空格,也就是无法直接根据name:randy hong查询,而name:"randy hong"...