搜索

大约有 20 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0052秒)

1.RE: scws 词库与dict_user.txt文件有什么关系?

发布时间:2012-04-18 11:04 t By hightman

自己看文档吧。这个是自定义词库

2.scws 词库与dict_user.txt文件有什么关系?

发布时间:2012-04-13 09:04 t By 290977824@qq.com

如题!!!

3.请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-06-29 21:06 t By 阿弟2013

...在postgresql整合了scws,效果很棒,现在我们自己增加了一些词库,不知道xdb与txt相比,那个效率更高 另外,scws对于中英文分词效果不是很好,即文中的中文分得还可以,但对于页面中的英文部分,包括email,url,host这类处理效果...

4.RE: 自定义词库dict_user.txt多大为宜

发布时间:2012-05-03 15:05 t By hightman

基本上无影响,不需要填的

5.RE: 请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-06-29 22:06 t By hightman

后者是什么意思,举例说明一下吧。SCWS处理英文是按普通单词和数字的规则来做

6.自定义词库dict_user.txt多大为宜

发布时间:2012-04-28 15:04 t By yunxiaoad2

还有,现在自定义了几个词库,分别是9M、7M,24k 看到文档说,这个文件读取后放在临时目录,建议不要太大,但我不知道多大才叫大,可否有个具体数据指导? 另外,这些新词,我通过官方提供的get_tf.php查询了一百个词,...

7.RE: scws 词库与dict_user.txt文件有什么关系?

发布时间:2012-04-20 13:04 t By 290977824@qq.com

好吧,我试一下先

8.RE: 请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-07-05 15:07 t By 阿弟2013

网址和EMAIL tsearch都可以配置token的切分方法,可以整个切,也可以分开 html标签 tsearch也有一个tag token可以配置去不去徐

9.RE: scws 词库与dict_user.txt文件有什么关系?

发布时间:2012-04-20 13:04 t By hightman

同义词搜索需要“启用”详见文档吧

10.RE: 请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-07-03 16:07 t By hightman

但网址和EMAIL如果这样切,也太粗糙了吧。要全部匹配才能检索到,输入 EMAIL 的前段或网址的一部分均检索不到了。 至于消除 HTML 标签,这不应该是分词的事哦

12
  • 时间不限
  • 按相关性排序