搜索

大约有 50 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0062秒)

31.scws-1.1.6 发布

更新时间:2011-04-20 15:04 t By hightman

1.修正夹杂在汉字中间的1-2个英文字符的词性为 en 而不是原来的 un 导致清除符号时消失. 2.调整将数字后面的独立 % 纳入整词作为百分比,如 33.3% 作为整词而不再是 33.3 和 % 3.修改连字符(-)和下划线(_)的规则,当出现在字母单词...

32.RE: 请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)

更新时间:2013-01-28 15:01 t By tisswb

...如何改成11 是否是使用xlen(1) 来设置?这个xlen对中文和英文如何计算长度? 请老大指教~

33.分享一个dict_user.txt

发布时间:2012-02-21 16:02 t By Dull

全部是英文单词 数据来源: twitter tumblr amazon alibaba flickr 等的标签 原来多是词组形式 改成了scws的单字形式 没有附加任何属性 也就是说全部使用默认属性 参考 http://www.xunsearch.com/doc/php/guide/index.dict

34.RE: 请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-06-29 22:06 t By hightman

后者是什么意思,举例说明一下吧。SCWS处理英文是按普通单词和数字的规则来做

35.自定义字典的问题

发布时间:2011-03-14 22:03 t By zfzeng

...定义了个词库,可是一用这个词库,就分不出来,数字和英文除外。 比如我定义“南瓜汤”,“番茄汤”作为一个词库,(测试用的,只放2个词在词库), 然后对这句话进行分词“我爱喝南瓜汤,番茄汤”进行分词, 希望得到...

36.三个问题需要求教

发布时间:2011-01-17 11:01 t By nftw

1, 当英文或数字与汉字链接时,词性会被视为un。如"LG集团",LG与集团紧连着,这种情况下,我希望把LG也视为en。能不能通过修改rules改变呢?因为我不是太理解un指的是什么,好像助词'的'、标点符号等都被视为un。我在插入...

37.同义词搜索

...不可以是多个词组成的短语。 > tip: 独立词汇的意思对于英文来说就是一个单词,对于中文来说必须是 `scws` 词库中的一个词。 > _Xunsearch_ 的同义词不同于 _Xapian_,会智能进行字段匹配和转换,您只需维护通用词库。 英文同...

38.mysql 其实支持中文全文检索的

发布时间:2010-05-14 10:05 t By xiaolan

只是。。。 没法用而已。。 因为英文中都是用空格进行分割的 不过如果将ft_min_word_len改为2, 然后在程序里将内容用scws进行分词,然后存入数据库单独的字段里,用空格分开,检索的时候, 用mysql的全文检索,可以检索到...

39.RE: 有没有添加单个或多个词的函数?

发布时间:2010-08-02 11:08 t By backluck

...[/quote] 现在没有这个需求了,因为我的非法词库里面有英文的词语

40.C版简易中文分词-cscwsd-0.0.3 发布

发布时间:2007-06-06 10:06 t By hightman

[b][size=3]简要说明[/size][/b] cscwsd 是英文全称 C-Simpled Chinese Word Segment Daemon 的首字缩写,这是用标准纯 C 编写,并配合使用 autoconf GNU软件工具包, 基本上可以很方便在的各类 Unix-Like OS 系统下顺利编译执行。目前测试过的有 RedHat...

12345
  • 时间不限
  • 按相关性排序