搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

11.RE: 麻烦站长解释一下“透过scws_get_result()取数据时自行排除单个字”

发布时间：2010-08-22 00:08 t By hightman

返回的时候根据长度排除啊，GBK的话单字就是2字节，很好判断啊，UTF-8三字节，但也能判断出是不是一个单个的汉字

12.RE: 搜索问题

更新时间：2012-10-25 13:10 t By hightman

...检索了，大概有几种办法： 1. 你把词典删除就可以搜索单字了。etc/dict.utf8.xdb ... 2. 或者要强制检索单还可以考虑修改C代码的部分，修改 src/import.h #define DEFAULT_SCWS_MULTI 3 把 3 改为 15 然后重新编译并重建索引...

13.RE: 麻烦站长解释一下“透过scws_get_result()取数据时自行排除单个字”

发布时间：2010-09-10 14:09 t By johnbaby

[quote='hightman' pid='3685' dateline='1282406611'] 返回的时候根据长度排除啊，GBK的话单字就是2字节，很好判断啊，UTF-8三字节，但也能判断出是不是一个单个的汉字 [/quote] 原来如此。明白了。非常感谢！

14.XSSearch::setScwsMulti

...作用, 由于 query 设计的方式问题, 目前无法支持搜索语句单字切分, 但您可以在模糊检索时设为 0 来关闭复合分词

15.分享一个dict_user.txt

发布时间：2012-02-21 16:02 t By Dull

全部是英文单词数据来源： twitter tumblr amazon alibaba flickr 等的标签原来多是词组形式改成了scws的单字形式没有附加任何属性也就是说全部使用默认属性参考 http://www.xunsearch.com/doc/php/guide/index.dict

16.RE: 请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)

更新时间：2013-01-28 15:01 t By tisswb

...ote] 如何设置成其他的值呀最近的一个项目需要全部的单字在项目的ini里，tokenizer = default 如果是3的话不知到如何改成11 是否是使用xlen(1) 来设置？这个xlen对中文和英文如何计算长度？请老大指教~

17.高手请进，关于关键字的分词

发布时间：2010-12-19 09:12 t By stevenym

...，在一个文章里有很多的字，比如“我，的，在，”这些单字，是不是也会被分出来，我想问的是，能不能取出像地名，人名，词语，我想在一个网站中应该这些，请问有没有相关的案例可以看一下，谢谢各位，我的服务器...

18.XSTokenizerScws的一个使用问题

发布时间：2013-01-29 10:01 t By tisswb

... ) ) [/quote] 我希望的结果是把两个字分成两个单字：‘是’，‘一’。而我在http://www.xunsearch.com/scws/demo/v4.php 进行测试的时候，却是我希望的结果。不知道是我使用的问题还是咱们xunsearch内置的这个有其他方面的设...

19.RE: 从windows迁移到linux发生的问题

更新时间：2013-12-18 22:12 t By favii

...，原先有set_ignore时无返回的，现在全部拆成了一个一个单字，太奇怪了。[hr] 补充一句：我安装的版本是scws-1.2.2

20.RE: 三个问题需要求教

更新时间：2011-01-17 16:01 t By hightman

...的散字都会自动按2元切分法，对于搜索来说效果要好于单字。

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索