搜索

大约有 182 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0986秒)

21.RE: 分享一个dict_user.txt

发布时间:2012-02-22 11:02 t By hightman

感谢分享,不过英文单词不需要词库啊。

22.RE: 分享一个dict_user.txt

发布时间:2012-05-04 22:05 t By yunxiaoad2

他想说的重点是有词性吧?

23.RE: 自定义的 txt 字典 有关问题 求助

发布时间:2010-04-10 13:04 t By lerado

哦,是用tab符分开呀,我还以为用空格分开呢,我又重新生成了一次,看了一下分词效果还不错。 谢谢。

24.分词问题

发布时间:2010-10-14 16:10 t By cp115

...没加$so->add_dict("dict.xdb",SCWS_XDICT_XDB); $so->add_dict("dict.txt",SCWS_XDICT_TXT); 这个情况下“云计算”分词如下:"云 计算"。我加了$so->add_dict("dict.xdb",SCWS_XDICT_XDB); $so->add_dict("dict.txt",SCWS_XDICT_TXT); 并在txt文件中加入 “云计算 14....

25.RE: 载入txt词典所出现的BUG

发布时间:2011-08-10 09:08 t By hightman

奇怪你这个问题我这不能复现。 我完全复制了你的代码,执行若干次结果仍然是正确的,返回三个词,每个的次数均为 1 [attachment=37] [attachment=38]

26.RE: 为何导出txt,里面内容不动在创建XDB之后速度变慢很多很多

发布时间:2011-03-09 12:03 t By hightman

导出的TXT格式的顺序并不能说明什么。。。。

27.RE: 自定义的 txt 字典 有关问题 求助

发布时间:2010-04-10 01:04 t By hightman

最长的词16个汉字,250个英文字母。 应该是你的词典做错了,比如字符集不匹配之类。生成词典要严格按照字段区分开,字段之间用区分,这说都有相关的说明,按说明操作应当没有问题。

28.分享一个dict_user.txt

发布时间:2012-02-21 16:02 t By Dull

全部是英文单词 数据来源: twitter tumblr amazon alibaba flickr 等的标签 原来多是词组形式 改成了scws的单字形式 没有附加任何属性 也就是说全部使用默认属性 参考 http://www.xunsearch.com/doc/php/guide/index.dict

29.scws 词库与dict_user.txt文件有什么关系?

发布时间:2012-04-13 09:04 t By 290977824@qq.com

如题!!!

30.请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-06-29 21:06 t By 阿弟2013

...ws,效果很棒,现在我们自己增加了一些词库,不知道xdb与txt相比,那个效率更高 另外,scws对于中英文分词效果不是很好,即文中的中文分得还可以,但对于页面中的英文部分,包括email,url,host这类处理效果比较差,我们目前...

  • 时间不限
  • 按相关性排序