搜索

大约有 40 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0071秒)

21.RE: scws 词库与dict_user.txt文件有什么关系?

发布时间:2012-04-19 11:04 t By hightman

不明白你说的。同义词是基于分词后的结果制作的。 如果你的索引先前制作,后面再添加自定义词,那么当然无效了。你要重建索引

22.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

更新时间:2010-11-13 10:11 t By snakeyasin

...emo/v4.php]http://www.ftphp.com/scws/demo/get_tfidf.php [/url](用于新词添加时不知怎么设tf,idf的话) 基于SCWS自动分类演示:[url=http://www.ftphp.com/scws/demo/a.php]http://www.ftphp.com/scws/demo/a.php[/url](输入一段文字系统自动给出最合适的分类建议) [...

23.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

发布时间:2012-11-06 22:11 t By umland

...emo/v4.php]http://www.ftphp.com/scws/demo/get_tfidf.php [/url](用于新词添加时不知怎么设tf,idf的话) 基于SCWS自动分类演示:[url=http://www.ftphp.com/scws/demo/a.php]http://www.ftphp.com/scws/demo/a.php[/url](输入一段文字系统自动给出最合适的分类建议) [...

24.求TF/IDF算法。

发布时间:2011-12-24 16:12 t By emo

老大,能把您的TF/IDF算法共享出来么?批量添加词库的时候真的很不方便啊,如果写个脚本调用你的[url=http://www.ftphp.com/scws/demo/get_tfidf.php]在线TF/IDF算法工具[/url],恐怕上万条请求你的服务器招架不住啊。。。 老大你的词库更...

25.自定义 SCWS 词库

...端,那么每个服务端独自使用自己的自定义词典文件。 添加删除修改自定义词库只要编辑该文件即可,以下为相关规范: - 文件为纯文本文件,编码必须是 UTF-8,可用任何编辑器修改 - 每行一条记录表示一个词,每行包含 1...

26.关于中英文混合切词

发布时间:2012-04-01 17:04 t By breeze

比如说我要切割“Adidas/阿迪达斯是一个著名的运动品牌” 在自定义词库里我添加了"Adidas/阿迪达斯" 但结果是Adidas / 阿迪达斯 请问能否判断是一个自定义的整词吗?就是说按我设置的词库来分

27.[2013] SCWS-1.2.2 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

...d2s10 的注释,已不包含它的代码 6) 为独立使用的 .h 文件添加 C++ 的 extern "C" 标记以便直接使用:xdb.h,xdict.h,xtree.h,pool.h,darray.h [b]scws-1.1.8 发布于 2011-07-30[/b] 1) win32/目录新增 vc9 工程文件, 默认为 php-5.3.x 提供的 php_scws.dll...

28.RE: “枪王之王”分词不是很满意!

发布时间:2010-09-13 00:09 t By johnbaby

后来我在自定义词库添加了 枪王之王 枪王 “枪王”就出来了。但是“王之王”又自动消失了。这个自定义词库还真是不是很理解。上次我分“山楂树之恋”的时候。我想让分词分成:“山楂树”和“树之恋”。但怎么弄“...

29.搜索分词只希望第一层怎么办?

发布时间:2014-05-11 00:05 t By dashzhao

...:(pos=2) OR 货品:(pos=3)))[/code] 但是我有在自定义词库里面添加“迪卡侬” 所以我不希望“迪卡侬”再被切分,而希望是这样: [code]Xapian::Query(((迪卡侬:(pos=1) OR 蓝色:(pos=2) OR 货品:(pos=3)))[/code] 请问怎么解决呀?

30.RE: 官方和提供的下载不一样,并且官方实例还写了错误代码

更新时间:2010-07-15 01:07 t By sulwan

我说您写错的实例是说的,您添加自定义词库那里,您多写了一个t,[hr] 您说的我都检查了,没有错,但是就是分词不对,我下的都是您最新版本的,您自己看看是不是词库提供错了呢?分词真的不对。

1234
  • 时间不限
  • 按相关性排序