搜索

大约有 196 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0051秒)

61.RE: scws与多线程

发布时间:2010-12-08 10:12 t By hightman

...ad_scws->d = main_scws->d; thread_scws_r = main_scws->r; 来共用它们,因为词典和规则集都是只读而且各API都是线程安全。

62.RE: 自定义的 txt 字典 有关问题 求助

发布时间:2010-04-08 09:04 t By lerado

我想问一下,自定义的词典里,只有word,没有其它TF、IDF、Attr可以吗?能生成吗。 因为我试了直接加载TXT的太慢了,想转换成XDB。

63.RE: 更新文档能只更新一个字段吗?

发布时间:2014-01-28 14:01 t By chinapubmed

我以前问过,不能单独更新特定字段的。只能全部更新,因为你ini文件里边都设置好了每个域的。 不过要是能只更新某个字段的话就非常好了,

64.RE: 搜索区间过滤 addRange不起 作用

发布时间:2011-12-12 11:12 t By vist2007

...23606756'] 从打印结果看得很明显 addRange 没有效果。 这是因为 setQuery() 相当于清除所有查询条件,所以你必须把 addRange, setSort 放在 setQuery 之后 $search->setQuery($q)->setLimit(...)->addRange(...)->setSort(); [/quote] 3KS

65.RE: 「清除标点符号断词」错误回报

发布时间:2010-05-16 22:05 t By hightman

清除符号本质上是根据词性来处理的。勾上词性后发现这些被清除的词性都是 un 所以会被清除,这是因为词典的数据不对导致的,之前的繁体词典是一位朋友帮忙整理的,可能有所缺漏和不对。

66.RE: 中文分组粗分方法

发布时间:2010-05-27 11:05 t By hightman

...出现的越高) IDF是逆词频率,也就是说这个词更重要(因为罕见一些);具体参见:http://baike.baidu.com/view/1228847.html 并没有很固定的算法,SCWS中的tf/idf均经过特殊加工处理了

67.RE: XSTokenizerScws的一个使用问题

发布时间:2013-01-30 14:01 t By hightman

是你自己搞错了! “是一”本身不是词,只是因为二元结合法所以scws自动将其合成为一个词。 复合分词是对原本是词的长词情况处理的,比如”中国“可以切成”中“+”国“+”中国“ 你的问题必须是 [code] $tk = $tokenizer->s...

68.RE: 怎么去掉英文数字超过2个会被切分的限制

发布时间:2013-12-27 10:12 t By hightman

目前没办法。因为我们认为3个字母以上独立成词完全没问题了

69.关于讯搜的搜索语句过长

更新时间:2013-08-22 15:08 t By 艺林游魂

...oo long(S#402) 我想问下关于讯搜的搜索语句过长的问题。 因为当搜索语句过长的时候会报错,用户体验很不好。 在哪里可以获取搜索语句的长度。或者当超过长度限制的时候在哪里可以判断。 有没有一种方法就是可以当长度...

70.RE: xunsearch 的 8383/8384 两个端口做什么用

发布时间:2011-10-18 12:10 t By hightman

8383是索引服务。 8384是搜索服务。 你的连不上应该是因为你的系统开了 SELinux 功能导致一些功能受限,你查查怎么设置啊 还有不要一直重复发主题,汗!

  • 时间不限
  • 按相关性排序