搜索

大约有 70 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2934秒)

21.split无效

更新时间:2014-07-23 11:07 t By q398044828

index=self时,split分词器会执行,但是index=mixed时,split分词器就会执行 这是怎么回事? 这是我字段内容 1=2&3=1&4=3-------------- 这是字段配置 [userinfo] tokenizer = split(&) type = string index = mixed 搜索1=2 分词执行,搜索userinfo:1=2 分词器才会...

22.split无效

更新时间:2014-07-23 11:07 t By q398044828

index=self时,split分词器会执行,但是index=mixed时,split分词器就会执行 这是怎么回事? 这是我字段内容 1=2&3=1&4=3-------------- 这是字段配置 [userinfo] tokenizer = split(&) type = string index = mixed 搜索1=2 分词执行,搜索userinfo:1=2 分词器才会...

23.自定义“词性”

发布时间:2010-06-26 11:06 t By 逆雪寒

...义 电脑 dn dn 就是我自定义的词性。这样我在scws 分词后,程序中可以用来判断。 知道是否可以目前? 感谢hightman 大哥 提供的那么好用的分词工具。

24.RE: small50,big161这种词汇搜索

发布时间:2013-06-18 11:06 t By hightman

@FIXME: 先记录一下,这是因为你既是自定义分词器又指定了 non_bool 参与权重计算。 那么 SDK 端先按自定义分词器拆分重新组合成查询语句,发送到 xapian 解析器时由于是 boolean prefix,因此它又会调用内部切词法再次切割。 简...

25.一个疑问……

发布时间:2007-11-28 22:11 t By 逍遥小妖

...搜索引擎结合…… 现在目前已经成功用SCWS替换其原本的分词代码。 但是却发现一个问题,就是SCWS的适用范围似乎特别的窄…… 对于一个页面来说,通常含有数字、英文、英文标点、中文标点、中文等文字要素(可阅读部分...

26.二元分词问题

发布时间:2011-11-14 17:11 t By icebolt

... [pid] type = id [subject] index = both tokenizer =xlen(2) 二元分词只能对英文生效,对中文生效 同时急于需要一元分词,主要是做黑词筛选用,因为有的时候就要搜索某些一元词,比如 武器 near/2 售,但是能实现

27.自定义分词

自定义分词器 `Xunsearch` 默认内置了功能强大的 [SCWS][1] 分词系统,也附加提供了一些简单常见的分词规则, 但考虑到用户的个性需求,特意提供了自定义分词器的功能。 > note: 自定义分词器存在一个缺陷,它支持存...

28.构建搜索语句

...部默认采用 `AND` 规则, 也就是说要求列出来的关键词(分词之后)全部匹配,如果您通过 [XSSearch::setFuzzy] 开启了模糊匹配,那么相当于采用 `OR` 规则,只要其中一个关键词匹配即可。 刚刚说的这种搜索的是索引数据库的“混...

29.图片搜索的一些疑问

更新时间:2014-02-16 17:02 t By Mr.

...相等的数据,然后根据hash_196字段按匹配度排序 我对xlen分词是很了解 这个排序mysql可以实现 但是mysql分割后的位置是固定的 project.name = hash project.default_charset = UTF-8 server.index = /dev/shm/xs-indexd.sock server.search = /dev/shm/xs-se...

30.RE: 这个支持英文词典和中英文混合词典啊

发布时间:2012-02-22 19:02 t By vanni

如果只要文章中有Linux出现就算是Linux相关文章的话,其实是需要分词了,直接用全文搜索Linux就好了。 只是SCWS目前看前来它的自定义词典支持超过3个字,如果可以的话,可以通过自定义“Linux优化”来指定分词

  • 时间不限
  • 按相关性排序