搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0071秒)

51.RE: xunsearch是否支持一元分

发布时间:2011-12-08 11:12 t By hightman

如果你了解scws就会知道它其实对散字也是自动二元处理。 你所谓的一元是一个一个?你也可以拓展 XSTokenizer 自己实现分

52.我对切尝试做了下功能修改

更新时间:2013-12-27 20:12 t By linqingtao

.../ MAX_ALNUM_CUT是中英文混合的最多多少个数字或字母就作为一个单独的 // 原代码默认是2 修改为了一个宏 // 这部分处理的是开头有数字或字母的情况 // 如 “ABC中国足球" 之类的结果 // 对于上面的...

53.RE: “有空间”的分有问题和扩充

发布时间:2013-05-20 13:05 t By hightman

你可以添加一个“有空间”作为,这样再细分时会出现“有空”+“空间” 作为三字的肯定是取舍其中一个

54.RE: 中文分组粗分方法

发布时间:2010-05-26 14:05 t By hightman

...的。 scws 里面先按逐字把所有可能的都列出来,建成一个2维表,然后把有岐义的部分拧出来,以其中一个为主体进行计算权重,看哪个情况最优。 此外还有根据rules规则匹配。 简单举个例子: “开放下载” 1. 开/...

55.RE: scws与多线程

发布时间:2010-12-08 14:12 t By hightman

...变量,应当已经是共用的了; 至于 mode 看需要吧,只是一个整型 ,如果你在不同线程中切分建议各自用一个 mode ,除非你自己能确定它们的切设置是共用的(主要用于保存切中那些是否忽略符号,是否复合分等的设置)

56.“有空间”的分有问题和扩充

更新时间:2013-05-18 14:05 t By lyjkensou

...的话,就不能进行.xdb到.txt的转换了吗? 添加新时,一个能对应多个性吗?

57.RE: [2010] SCWS-1.1.3 发布,支持文本典实现自定义库啦!!

更新时间:2010-11-13 10:11 t By snakeyasin

...zend_parse_parameters() -- [b]scws-1.1.2 发布于 2010-5-9[/b] 这是一个小bug修正版,修正在非内存模式库时会导致人名识别失败的bug. -- [b]scws-1.1.1 发布于 2010-3-4[/b] 这是一个bug修正版,1.1.0 中存在内存泄露的重大bug。 -- [b]scws-1.1.0...

58.RE: small50,big161这种汇搜索不到

发布时间:2013-06-18 11:06 t By hightman

...,那先用 XSSearch::addQueryTerm 来构造搜索语句。 或者等下一个版本,考虑给 xapian 打个补丁,对于某些自定义分器的字段不再调用内部分

59.RE: [2010] SCWS-1.1.3 发布,支持文本典实现自定义库啦!!

发布时间:2012-11-06 22:11 t By umland

...zend_parse_parameters() -- [b]scws-1.1.2 发布于 2010-5-9[/b] 这是一个小bug修正版,修正在非内存模式库时会导致人名识别失败的bug. -- [b]scws-1.1.1 发布于 2010-3-4[/b] 这是一个bug修正版,1.1.0 中存在内存泄露的重大bug。 -- [b]scws-1.1.0...

60.使用自定义库的时候,部分会丢失

更新时间:2014-04-18 17:04 t By tianly

...库替换了dict.utf8.xdb,然后尝试分“朝鲜近日播放的一个纪录片中,发现”,发现“纪录片中”在分结果中丢失了 Array ( [word] => 朝鲜 [off] => 0 [len] => 6 [idf] => 0 [attr] => @ ) Array ( [word] => 近日 [off] => 6 [len] => 6 [idf] => 0 [attr] => ...

  • 时间不限
  • 按相关性排序