搜索

大约有 111 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0078秒)

101.编写第一个配置文件

...明显,它是主键,所以它的类型必须是 `id` - `fid` 内容为数字的版块ID,但由于我们不需要对它进行排序或区间查找,所以用 `string` 类型即可, 为了按版块检索,我们必须对它进行索引,而它也不需要分词,所以分词器用内置...

102.关于 SCWS 简易中文分词系统

更新时间:2013-01-10 16:01 t By hightman

...采集的词频词典,并辅以一定的专有名称,人名,地名,数字年代等规则识别来达到基本分词,经小范围测试大概准确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、关键字提取等场合运用。 切词效率测试(UTF-8编码,随机...

103.[2013] SCWS-1.2.2 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

...able-developer 选项的处理方式,不覆盖预设的 CFLAGS 4) 改变数字字母单独成词时的规则,当其中同时包含2个连续字母以及2个连续数字时强制拆分。例:原先单独的 iso9001 是整词,新规则切为 iso+9001 而 i9001 则保持不变仍为。这样...

104.按字段值分面搜索

...的,比实际数量可能会偏小。 > 如果您确实需要得到精确数字,请将 [XSSearch::setFacets] 的第二参数设为 true 。 > > 此外,分面搜索仅针对字段值较短的情况,当字段值的长度超过 **255** 字节时会被忽略而不参与统计。 > > 每次搜索...

105.scws-1.0.0 正式发布 (含php扩展及2文本词典)

更新时间:2010-01-29 13:01 t By hightman

...集的词频词典,并辅以一定的专 有名称,人名,地名,数字年代等规则识别来达到基本分词,经小范围测试大 概准确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、关键字提取 等场合运用。首次雏形版本发布于 2005 年...

106.RE: 请问一下,xdb与txt词库那个读取效率更高

更新时间:2013-06-29 23:06 t By 阿弟2013

...'); ?column? ---------- t (1 row) [hr] 还有如Unsigned integer这类的数字 postgres=# select to_tsvector('zw_simple','-0.25'); to_tsvector ------------- '0.25':1 (1 row) postgres=# select to_tsvector('simple','-0.25'); to_tsvector ------------- '-0.25':1 (1 row)

107.项目配置文件详解

... 服务端连接参数的格式包含 3 种格式: 1. *端口号(数字)*,连接 `localhost` 的该端口号 (例:`8383`) 2. *地址:端口号*,冒号连接地址(域名、IP地址)和端口 (例:`127.0.0.1:8383`) 3. *文件路径*,本机的 `unix socket` 连接路径...

108.获取搜索结果

...用默认排序方式。 > 排序默认也是按照字节序比较,对于数字型的字段请将字段类型设为 `numeric`。 > > 为了兼容,您也可以把多字段排序的参数直接传递给 [XSSearch::setSort] 即可。 > 读取搜索结果文档 --------------- 调用 [XSSearch::s...

109.构建搜索语句

...区间搜索默认用的是字节序比较,如果您希望将字段值以数字方式比较大小,请将字段的类型设置为 `numeric`。 查看搜索语句的分析结果 -------------------- 通过 [XSSearch::setQuery] 设置了搜索语句后,您可以调用 [XSSearch::getQuery] 查...

110.SCWS-php扩展的说明及用法

发布时间:2007-06-07 18:06 t By hightman

...明:设定分词所用的新词识别规则集(用于人名、地名、数字时间年代等识别)。 返回:成功返回 true 失败返回 false 参数:scws_handle 即之前由 scws_open 打开返回的; rule_path 是规则集的路径,可以是相对路径或完全路径...

  • 时间不限
  • 按相关性排序