搜索

大约有 105 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0980秒)

21.RE: 关于数词、量词

发布时间:2013-12-06 10:12 t By hightman

这个应该没办法,所有的调整都是基于词典,也就是词典的优先级最最高了。 可以用程序扫出类似的词来删除它们,因为互联网语料库这些自动都列到词里了。

22.xunsearch 磁盘

发布时间:2014-05-29 16:05 t By zzjin

翻了翻之前的帖子,基本都是说xunsearch非常的吃硬盘.. 我的数据大概在50W条左右,data目录只有不到500M的内容...但是每次搜索都需要40s(真的是40s)的时间才能返回数据 主机是在阿里云上面的,确实磁盘性能很差.. 有什么办法能把数...

23.删除问题

更新时间:2014-06-23 11:06 t By sszwei

大家好,想问下 我本地测试删除都是可以的 跑线上删除就是不行。。rebuild 单条删除 cleanindex都试过[hr] 换个名字完全可以。。。。项目名名字过长?

24.RE: 关于指定搜索项中,空格的问题

发布时间:2012-04-06 12:04 t By hightman

因为你用|分隔,所以要用 type:aaa|bbb 来做语句。 空格在语句中都是特殊的,所以如果用空格分隔可能会不对

25.英文可以自定义词性吗?

发布时间:2013-08-30 05:08 t By mynoname

通常英文是不需要分词的,但很多时候词性是需要的,比如nike,dior这类品牌英文。 目前默认词性都是en,有什么办法可否自定义词典来改变他的词性。 还有个问题,就是纯数字的词性为什么是en呢,不是m? 望赐教。

26.ubuntu 64位无法分词

发布时间:2013-11-05 12:11 t By luopuya

ubuntu13.04是用amd64.iso在虚拟机里安装的 分词几乎都是un 而在另一个32位ubuntu上则正常 字典是完好的的xdb 顺便问下有无txt格式的字典下载,用scws_gen_dict生成不知道行否

27.RE: 关于建立索引的疑问

更新时间:2012-03-03 15:03 t By yunxiaoad2

理论上不应该啊 我多次倒入几万条数据 其中每笔都是少量是新的 也没发现重复啊[hr] 你把操作数据贴出来 让别人重现一下 我怀疑你的主键输入过程中带了不可见字符

28.RE: 测试环境运行了几天,昨天出现一个错误

发布时间:2011-12-26 10:12 t By hightman

都是 setFacets 开启精确匹配才导致的吗?

29.RE: 中文分组粗分方法

更新时间:2010-05-29 01:05 t By baobao

谢谢马老师 [ 应该是吧:-)]的及时回复。 我在研读代码的时候,看到有段代码注释着,是对半字的处理,并不是很理解,对于文字都是1-4字节的UTF-8存储编码。 半字是种什么情况呢?

30.RE: 结合搜索引擎来制作自动标签系统

发布时间:2011-12-07 11:12 t By Dull

支持 同样需求此功能 Yahoo YQL, thetag.net 都是已经实现的 这个功能非常有必要

  • 时间不限
  • 按相关性排序