搜索

大约有 31 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1933秒)

1.PSCWS23 词典文件如何制作

发布时间:2011-11-28 11:11 t By alicar

PSCWS23 词典文件如何制作 xdb导入导出工具导出信息如下 ---------------------------------- # WORD TF IDF ATTR ---------------------------------- 除了表头,一个都没导出。。。。。。

2.RE: PSCWS23 词典文件如何制作

发布时间:2011-11-28 13:11 t By hightman

PSCWS23和scws的词典不一样。目前没有开放的导出代码,那份代码已经过时并停止开发了,不推荐使用

3.RE: 结合搜索引擎来制作自动标签系统

发布时间:2011-12-07 11:12 t By Dull

支持 同样需求此功能 Yahoo YQL, thetag.net 都是已经实现的 这个功能非常有必要

4.RE: 结合搜索引擎来制作自动标签系统

发布时间:2011-12-07 13:12 t By hightman

多谢建议。这个部分要做得精准的话其实是比较尖端的,SCWS分词后有提供一些热门词排序,如果简单归结为标签也是不妥的,我觉得需要有标签库进行匹配和比对。

5.RE: 结合搜索引擎来制作自动标签系统

发布时间:2011-12-08 08:12 t By Dull

scws分词后的直接做标签都有不错的效果了 :) 我理解其实就是搜索过程的一个反向 正常搜索就是 一句话 -> 分词 -> 搜索匹配 -> 输出 具体实现上 那匹配标签或者关键字这么做似乎也行 一句话 -> 分词 -> 搜索匹配 -> 前10个结果...

6.结合搜索引擎来制作自动标签系统

发布时间:2011-12-07 00:12 t By rogical

我一直在研究怎么作一个合适的自动标签系统,国外已经有几个了,yahoo就提供了的,让你把文章发给它,它给你返回适合你文章的几个标签。 这对于帮助用户的文章归类很有意义,因为通常用户不能很好的自我归类。 我...

7.RE: 结合搜索引擎来制作自动标签系统

发布时间:2011-12-14 09:12 t By rogical

这个权重分配上 可以由参数定制化。 最基础的当然是共有标签,重复度,当然要剔除很基础的日常词汇,保留分类性的,这个不能简单由前10来实现,比如‘你好’被分词出来,而且频度很高,却不适合做标签的; 有些热门...

8.制作词库的时候有一堆没用的报错(make_xdb_file)

发布时间:2013-08-06 15:08 t By Panda006

Notice: Undefined index: part in C:\Users\Administrator\Desktop\tool\dev\make_xd b_file.php on line 92 PHP Notice: Undefined index: part in C:\Users\Administrator\Desktop\tool\dev\ma ke_xdb_file.php on line 92 Notice: Use of undefined constant key - assumed 'key' in C:\Users\Administrato Des...

9.RE:1251

发布时间:2008-04-26 08:04 t By hightman

...要将rules.utf8.ini和dict.utf8.xdb改为繁体的词典即可. 词典制作参见相关代码里的工具 scws-1.0 里包含了词典制作工具. 顺便奉上之前整理制作的繁体数据. [url]http://www.hightman.cn/down/rules_cht.utf8.ini[/url] [url]http://www.hightman.cn/down/dict_c...

10.RE: scws 词库与dict_user.txt文件有什么关系?

发布时间:2012-04-19 11:04 t By hightman

不明白你说的。同义词是基于分词后的结果制作的。 如果你的索引先前制作,后面再添加自定义词,那么当然无效了。你要重建索引

1234
  • 时间不限
  • 按相关性排序