搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

31.scws-1.1.6 发布

更新时间：2011-04-20 15:04 t By hightman

1.修正夹杂在汉字中间的1-2个英文字符的词性为 en 而不是原来的 un 导致清除符号时消失. 2.调整将数字后面的独立 % 纳入整词作为百分比，如 33.3% 作为整词而不再是 33.3 和 % 3.修改连字符(-)和下划线(_)的规则，当出现在字母单词...

32.RE: 请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)

更新时间：2013-01-28 15:01 t By tisswb

...如何改成11 是否是使用xlen(1) 来设置？这个xlen对中文和英文如何计算长度？请老大指教~

33.分享一个dict_user.txt

发布时间：2012-02-21 16:02 t By Dull

全部是英文单词数据来源： twitter tumblr amazon alibaba flickr 等的标签原来多是词组形式改成了scws的单字形式没有附加任何属性也就是说全部使用默认属性参考 http://www.xunsearch.com/doc/php/guide/index.dict

34.RE: 请问一下，xdb与txt词库那个读取效率更高

发布时间：2013-06-29 22:06 t By hightman

后者是什么意思，举例说明一下吧。SCWS处理英文是按普通单词和数字的规则来做

35.自定义字典的问题

发布时间：2011-03-14 22:03 t By zfzeng

...定义了个词库，可是一用这个词库，就分不出来，数字和英文除外。比如我定义“南瓜汤”，“番茄汤”作为一个词库，(测试用的，只放2个词在词库)，然后对这句话进行分词“我爱喝南瓜汤，番茄汤”进行分词，希望得到...

36.三个问题需要求教

发布时间：2011-01-17 11:01 t By nftw

1，当英文或数字与汉字链接时，词性会被视为un。如"LG集团"，LG与集团紧连着，这种情况下，我希望把LG也视为en。能不能通过修改rules改变呢？因为我不是太理解un指的是什么，好像助词'的'、标点符号等都被视为un。我在插入...

37.同义词搜索

...不可以是多个词组成的短语。 > tip: 独立词汇的意思对于英文来说就是一个单词，对于中文来说必须是 `scws` 词库中的一个词。 > _Xunsearch_ 的同义词不同于 _Xapian_，会智能进行字段匹配和转换，您只需维护通用词库。英文同...

38.mysql 其实支持中文全文检索的

发布时间：2010-05-14 10:05 t By xiaolan

只是。。。没法用而已。。因为英文中都是用空格进行分割的不过如果将ft_min_word_len改为2，然后在程序里将内容用scws进行分词，然后存入数据库单独的字段里，用空格分开，检索的时候，用mysql的全文检索，可以检索到...

39.RE: 有没有添加单个或多个词的函数？

发布时间：2010-08-02 11:08 t By backluck

...[/quote] 现在没有这个需求了，因为我的非法词库里面有英文的词语

40.C版简易中文分词-cscwsd-0.0.3 发布

发布时间：2007-06-06 10:06 t By hightman

[b][size=3]简要说明[/size][/b] cscwsd 是英文全称 C-Simpled Chinese Word Segment Daemon 的首字缩写，这是用标准纯 C 编写，并配合使用 autoconf GNU软件工具包, 基本上可以很方便在的各类 Unix-Like OS 系统下顺利编译执行。目前测试过的有 RedHat...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索