搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

21.split无效

更新时间：2014-07-23 11:07 t By q398044828

index=self时,split分词器会执行,但是index=mixed时,split分词器就不会执行这是怎么回事? 这是我字段内容 1=2&3=1&4=3-------------- 这是字段配置 [userinfo] tokenizer = split(&) type = string index = mixed 搜索1=2 分词器不执行,搜索userinfo:1=2 分词器才会...

22.split无效

更新时间：2014-07-23 11:07 t By q398044828

index=self时,split分词器会执行,但是index=mixed时,split分词器就不会执行这是怎么回事? 这是我字段内容 1=2&3=1&4=3-------------- 这是字段配置 [userinfo] tokenizer = split(&) type = string index = mixed 搜索1=2 分词器不执行,搜索userinfo:1=2 分词器才会...

23.自定义“词性”

发布时间：2010-06-26 11:06 t By 逆雪寒

...义电脑 dn dn 就是我自定义的词性。这样我在scws 分词后，程序中可以用来判断。不知道是否可以目前？感谢hightman 大哥提供的那么好用的分词工具。

24.RE: small50,big161这种词汇搜索不到

发布时间：2013-06-18 11:06 t By hightman

@FIXME: 先记录一下，这是因为你既是自定义分词器又指定了 non_bool 参与权重计算。那么 SDK 端先按自定义分词器拆分重新组合成查询语句，发送到 xapian 解析器时由于不是 boolean prefix，因此它又会调用内部切词法再次切割。简...

25.一个疑问……

发布时间：2007-11-28 22:11 t By 逍遥小妖

...搜索引擎结合…… 现在目前已经成功用SCWS替换其原本的分词代码。但是却发现一个问题，就是SCWS的适用范围似乎特别的窄…… 对于一个页面来说，通常含有数字、英文、英文标点、中文标点、中文等文字要素（可阅读部分...

26.二元分词问题

发布时间：2011-11-14 17:11 t By icebolt

... [pid] type = id [subject] index = both tokenizer =xlen(2) 二元分词只能对英文生效，对中文不生效同时急于需要一元分词，主要是做黑词筛选用，因为有的时候就要搜索某些一元词，比如武器 near/2 售,但是不能实现

27.自定义分词器

自定义分词器 `Xunsearch` 默认内置了功能强大的 [SCWS][1] 分词系统，也附加提供了一些简单常见的分词规则，但考虑到用户的个性需求，特意提供了自定义分词器的功能。 > note: 自定义分词器存在一个缺陷，它不支持存...

28.构建搜索语句

...部默认采用 `AND` 规则，也就是说要求列出来的关键词（分词之后）全部匹配，如果您通过 [XSSearch::setFuzzy] 开启了模糊匹配，那么相当于采用 `OR` 规则，只要其中一个关键词匹配即可。刚刚说的这种搜索的是索引数据库的“混...

29.图片搜索的一些疑问

更新时间：2014-02-16 17:02 t By Mr.

...相等的数据，然后根据hash_196字段按匹配度排序我对xlen分词器不是很了解这个排序mysql可以实现但是mysql分割后的位置不是固定的 project.name = hash project.default_charset = UTF-8 server.index = /dev/shm/xs-indexd.sock server.search = /dev/shm/xs-se...

30.RE: 这个不支持英文词典和中英文混合词典啊

发布时间：2012-02-22 19:02 t By vanni

如果只要文章中有Linux出现就算是Linux相关文章的话，其实是不需要分词了，直接用全文搜索Linux就好了。只是SCWS目前看前来它的自定义词典不支持超过3个字，如果可以的话，可以通过自定义“Linux优化”来指定分词

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索