搜索

大约有 111 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1945秒)

61.RE: 对于分词的一些困惑

发布时间:2010-10-13 17:10 t By hightman

由于分词规则开头会先进行中英文粗分,那时就强行把数字、字母与多字节的汉字拆分开。 只有夹在汉字中间的1~2个数字或字终才被允许和汉字组合,比如“T恤” ”Q币“ 这种。 假设你的词典里有”北海36“,被分的句子是...

62.10秒 10元 这样的想做为一个词要怎么配置

发布时间:2011-10-28 17:10 t By xjtdy888

10秒 10元 这样的想做为一个词要怎么配置 ?? 我尝试了修改rule.ini但是不成功。如果数字是全角的话倒是可以成为词,但我同时也需要半角的数字+单位 作为一个词,

63.三个问题需要求教

发布时间:2011-01-17 11:01 t By nftw

1, 当英文或数字与汉字链接时,词性会被视为un。如"LG集团",LG与集团紧连着,这种情况下,我希望把LG也视为en。能不能通过修改rules改变呢?因为我不是太理解un指的是什么,好像助词'的'、标点符号等都被视为un。我在插入...

64.RE: 在使用scws中遇到的怪问题,ip地址问题和网址都好像有点问题

发布时间:2010-05-26 14:05 t By hightman

IP可能是被当做数字了,这个问题我想我得好好考虑一下呵。 数字可以允许一个点出现,所以出现了这样的情况,

65.scws-1.1.6 发布

更新时间:2011-04-20 15:04 t By hightman

...词性为 en 而不是原来的 un 导致清除符号时消失. 2.调整将数字后面的独立 % 纳入整词作为百分比,如 33.3% 作为整词而不再是 33.3 和 % 3.修改连字符(-)和下划线(_)的规则,当出现在字母单词之间时视为同一词而不再强行切开,此时...

66.我对切词尝试做了下功能修改

更新时间:2013-12-27 20:12 t By linqingtao

...} } else { // fix me 这个地方是前面有字母或数字的切词 // MAX_ALNUM_CUT是中英文混合的最多多少个数字或字母就作为一个单独的词 // 原代码默认是2 修改为了一个宏 // 这部分处理的是开头有数字...

67.关于 numeric 类型精度问题

发布时间:2011-12-05 17:12 t By vist2007

对于 numeric 类型的索引 超过 100万 的数字 numeric 类型会出现 精度丢失问题 通过floatval 无法还原原始数据 这个问题如何解决?

68.RE:1238

发布时间:2007-06-12 21:06 t By hightman

1.单字节的数字和中文字目前的规则不允许一起存在,像45万就可以,或四十五万 2."当好"在词典中出现并有较高的频率,这可能是错误的,可以修正词典.关于词典的问题有相关文章已经说过了,词库太大,出错...

69.RE: 关于排序问题

发布时间:2014-05-09 10:05 t By bigxu

index=self 是对的。 你的cat_id是数字吗? getAddTerms 打印出看下。 如果有index,有term。查不出应该是不可能的.

70.关于 配置文件 主键的类型问题

发布时间:2014-09-10 16:09 t By wkx198742

我在使用的过程中主键一直是数字型,现在想将主键改用字符和数字型结合是否可行,请大家帮忙!

  • 时间不限
  • 按相关性排序