搜索

大约有 105 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1945秒)

61.搜寻结果乱套

更新时间:2014-06-03 18:06 t By caterfillar

...搭休閒款內條紋2件式棉T 78. "韓版"百搭休閒款露肩包臀英文背心(現貨2色) 79. "韓版"百搭休閒款露肩包臀英文背心(現貨2色) 80. "韓版"百搭休閒款~露肩包臀內搭英文背心 87. "韓版"百搭休閒款~長板翻領針織連帽毛衣外套(現貨2...

62.scws分词碰到连字符的词处理的问题

发布时间:2010-06-23 10:06 t By nickflyer

我在自己的网站上使用scws做分词,当文章中有类似PC-BSD之类有连字符的英文词时,都分成类“PC - BSD”,但这是个软件名,本不应分开,英文中加-号的一般都视为一个词,按理说不应分开的,有什么方法解决吗?

63.一个疑问……

发布时间:2007-11-28 22:11 t By 逍遥小妖

...似乎特别的窄…… 对于一个页面来说,通常含有数字、英文英文标点、中文标点、中文等文字要素(可阅读部分,HTML已过滤),视情况而定,搜索引擎还有可能抓出含有乱码的片段。 但是SCWS分词时似乎要求字符串中只能有...

64.RE: 怎样才能 字母数字汉字组合 按照词典分成一个词语呢?

更新时间:2013-07-03 11:07 t By shuyinglee

...究了一下源代码,最终功夫不负有心人,成功的避过了中英文混合,使用字典中的词语分词,我用的是 scws-1.2.1.tar.bz2 这个版本,因为不能发附件,如果大家需要联系我: Email: shuyinglee@126.com[hr] 使用方法: 1.To patch tar xfvj sc...

65.请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-06-29 21:06 t By 阿弟2013

...,不知道xdb与txt相比,那个效率更高 另外,scws对于中英文分词效果不是很好,即文中的中文分得还可以,但对于页面中的英文部分,包括email,url,host这类处理效果比较差,我们目前采用两个分析器配合使用来达到最好的效果...

66.我对切词尝试做了下功能修改

更新时间:2013-12-27 20:12 t By linqingtao

...使用后发现有几个地方和自己的需求不符合, 1)、中英文混合的 英文超过2个字就会被切割,不管词典里面有没有这个数据,比如词典里面有 “ABC支持开源" , 对“ABC支持开源" 切词的结果是“ABC" "支持“ ”开源“, 而不...

67.同义词搜索

...不可以是多个词组成的短语。 > tip: 独立词汇的意思对于英文来说就是一个单词,对于中文来说必须是 `scws` 词库中的一个词。 > _Xunsearch_ 的同义词不同于 _Xapian_,会智能进行字段匹配和转换,您只需维护通用词库。 英文同...

68.功能建议:body增加注释功能?

更新时间:2012-04-10 21:04 t By Dull

...ch 中文译名为“迅搜”,代码中的经常被缩写为 XS,既是英文名称的缩略也是中文声母缩写。 这儿的“迅”是快速的意思,至少包含了两层涵义:其一代表了搜索结果的响应能力,其二则为二次开发难度、速度。 //还是注释 Xu...

69.RE: 如何优化xunsearch

发布时间:2013-07-29 12:07 t By gilroy

研究了一下源代码,最终功夫不负有心人,成功的避过了中英文混合,使用字典中的词语分词,我用的是 在调整每次读取数据的大小和缓冲区大小时有不同的情况

70.二元分词问题

发布时间:2011-11-14 17:11 t By icebolt

... id [subject] index = both tokenizer =xlen(2) 二元分词只能对英文生效,对中文不生效 同时急于需要一元分词,主要是做黑词筛选用,因为有的时候就要搜索某些一元词,比如 武器 near/2 售,但是不能实现

  • 时间不限
  • 按相关性排序