小扎亲自官宣Meta视觉大模型,自监督学习无需微调,多任务效果超OpenCLIP
声明:本文来自微信公众号“量子位”(ID:QbitAI),作者:萧箫,,授权站长之家转载发布。
【资料图】
无需文字标签,完全自监督的Meta视觉大模型来了!
小扎亲自官宣,发布即收获大量关注度——
在语义分割、实例分割、深度估计和图像检索等任务中,这个名叫DINOv2的视觉大模型均取得了非常不错的效果。
甚至有超过当前最好的开源视觉模型OpenCLIP之势。
虽然此前Meta就发布过自监督学习视觉大模型DINO,不过这次AI识别图像特征的能力显然更进一步,准确分割出了视频中的主体:
可别以为DINOv2通过自监督学会的只有图片分割。事实上,它已经能根据不同类别、不同场景下的照片,准确识别出同种物体(狗)的头部、身体和四肢长在哪:
换而言之,DINOv2自己学会了找图像特征。
目前Meta官方不仅已经放出了开源代码,而且还给了网页版Demo试玩。有网友内涵:
什么叫开源,LLaMA,SAM,DINOv2这才叫开源!
一起来看看,DINOv2的效果究竟如何。
准确识别不同画风的同种物体
事实上,DINOv2是基于上一代DINOv1打造的视觉大模型。
这个模型参数量是10亿级,也仍然是视觉Transformer架构(ViT),但与DINO不太一样的是,这次DINOv2在数据集上经过了精心挑选。
具体来说,DINOv2构建了一个数据筛选pipeline,将内容相似的图片精心筛选出来,同时排除掉相同的图片:
最终呈现给DINOv2的训练数据图片虽然没有文字标签,但这些图片的特征确实是相似的。
采用这类数据训练出来的视觉模型,效果如何?
这是DINOv2在8个视觉任务上的表现,包括语义分割、分类、深度估计等,其中橙色是自监督方法的效果,深粉色是弱监督方法的效果。
可以看见,经过自监督学习的视觉模型,表现上已经与经过弱监督学习的模型性能相当。
实际效果也不错,即便在一系列照片中,相同物体的画风并不相似,DINOv2也能准确识别它们的特征,并分到相似的列表中。
如(a)组中都具有翅膀的鸟和飞机、(b)组中的大象和大象雕塑、(c)组中的汽车和汽车玩具模型、(d)组中的马和涂鸦版马:
而且从PCA(主成分分析)图像效果来看,DINOv2不仅能准确分类,还能用不同颜色标出它们“相同”的部分,例如象鼻都是绿色、车轮都是红色、马的尾巴是黄色等。
换而言之,DINOv2能理解这些图像中的相似之处,就像人会形容飞机“看起来像一只鸟”一样。
目前DINOv2已经放出Demo,我们也试了试它的实际效果。
Demo直接可玩
官网已经开放语义分割、图像检索和深度估计三大功能的试玩。
据Meta介绍,这几个任务中,DINOv2在大多数基准上超过了目前开源视觉模型中表现最好的OpenCLIP。
我们先来看看深度估计的效果。
值得一提的是,在效果更好的情况下,DINOv2运行的速度也比iBOT更快,相同硬件下只需三分之一的内存,运行速度就能比DINOv2快上2倍多。
这是Meta论文中与OpenCLIP在实际例子上的比较效果:
我们用这张猛男版新宝岛试一下,看起来还不错,即使是高糊图片也能比较好地估计出深度:
接下来是语义分割的效果,这里也先给出Meta论文中的数据对比情况:
这里也给出OpenCLIP和DINOv2的对比,中间的图片是OpenCLIP的效果,右边是DINOv2分割的效果:
我们也用一张办公室的图片试了一下,看起来DINOv2还是能比较准确地分割人体、物体的,但在细节上会有一些噪点:
最后是图片检索。
官网上给出的图片效果还是挺不错的,输入铁塔照片,可以生成不少含铁塔的相似艺术图片:
这里我们也试了试,输入一张华强买瓜,给出来的艺术图片大多数与西瓜有关:
那么,这样的自监督视觉大模型可以用在哪里?
从Meta给出的视频来看,目前有一些比较环保的用途,例如用于估计全球各地的树木高度:
除此之外,如同扎克伯格所说,DINOv2还能被用于改善医学成像、粮食作物生长等。当然这里小扎还进一步强调:
可以被用于制作更具沉浸感的元宇宙。
嗯,看来Meta的元宇宙路线还将继续……
试玩Demo地址:https://dinov2.metademolab.com/demos
项目地址:https://github.com/facebookresearch/dinov2
(举报)
-
小扎亲自官宣Meta视觉大模型,自监督学习无需微调,多任务效果超OpenCLIP
站长之家 2023-04-18
-
最新消息:巴基斯坦西北部发生山体滑坡 仍有约10人情况不明 环球看热讯
城市头条网 2023-04-18
-
钉钉,把 AI “收了”-当前最新
ZAKER科技 2023-04-18
-
欧洲金靴积分排行榜:哈兰德领跑 凯恩第2姆巴佩第5
足坛欧美汇 2023-04-18
-
多家上市公司拟减持公司股份
第一财经资讯 2023-04-18
-
一季度固定资产投资同比上涨5.1%,房地产开发投资下降5.8%
华夏时报 2023-04-18
-
中性清洗剂介绍_中性清洗剂的性能_每日看点
互联网 2023-04-18
-
北京维效科技有限公司未经本人同意扣费88元
华声投诉 2023-04-18
-
【环球播资讯】误把村民当野兔开气枪致其身亡 江西4人被刑拘
大皖新闻”,违者将依法追究法律责任。
大皖新闻讯 据信州公安公众号消息 4月18日 信州公安分局发布警情通报。
通报称,2023年4月14日23时23分,信州公安分局沙溪派出所接到报警称:沙溪镇村民王某金在本村排水沟中死亡。接警后,民警立即赶到现场开展工作。
2023-04-18
-
今日要闻!由松果制成的艺术项目_40岁女人过生日送什么礼物好一些
趣礼物 2023-04-18
-
小扎亲自官宣Meta视觉大模型,自监督学习无需微调,多任务效果超OpenCLIP
站长之家 2023-04-18
-
最新消息:巴基斯坦西北部发生山体滑坡 仍有约10人情况不明 环球看热讯
城市头条网 2023-04-18
-
钉钉,把 AI “收了”-当前最新
ZAKER科技 2023-04-18
-
欧洲金靴积分排行榜:哈兰德领跑 凯恩第2姆巴佩第5
足坛欧美汇 2023-04-18
-
多家上市公司拟减持公司股份
第一财经资讯 2023-04-18
-
一季度固定资产投资同比上涨5.1%,房地产开发投资下降5.8%
华夏时报 2023-04-18
-
中性清洗剂介绍_中性清洗剂的性能_每日看点
互联网 2023-04-18
-
北京维效科技有限公司未经本人同意扣费88元
华声投诉 2023-04-18
-
【环球播资讯】误把村民当野兔开气枪致其身亡 江西4人被刑拘
大皖新闻”,违者将依法追究法律责任。
大皖新闻讯 据信州公安公众号消息 4月18日 信州公安分局发布警情通报。
通报称,2023年4月14日23时23分,信州公安分局沙溪派出所接到报警称:沙溪镇村民王某金在本村排水沟中死亡。接警后,民警立即赶到现场开展工作。
2023-04-18
-
今日要闻!由松果制成的艺术项目_40岁女人过生日送什么礼物好一些
趣礼物 2023-04-18
-
热头条丨SpaceX星舰下次发射时间瞄准4月20日晚间;
汇通财经网 2023-04-18
-
每日观察!【奋进的春天】盐城滨海:筑牢“工业强县”压舱石
央广网 2023-04-18
-
世界观速讯丨珠海站到珠海长隆海洋王国要多久 珠海站到珠海长隆海洋王国
城市网 2023-04-18
-
“春季黄河大集”开集啦!沿黄九省(区)+“八品下乡”共赴黄河口春日之约|天天快播
海报新闻 2023-04-17
-
小儿身高计算公式对照表_小儿身高计算公式-世界观点
互联网 2023-04-17
-
Redis 数据类型及操作-HyperLogLog|天天时快讯
腾讯云 2023-04-17
-
焦点资讯:交通运输部:推动交通运输新业态平台企业降低过高抽成
万隆证券网 2023-04-17
-
【全球热闻】AITO问界M5智驾版正式发布
财经网 2023-04-17
-
全球热文:无月租电话卡手机卡_手机卡有没有无月租的
互联网 2023-04-17
-
淮阳区组织开展“全民国家安全教育日暨保密宣传月”活动
搜狐号-信息新报 2023-04-17
-
贾汪区委政法委员会全体(扩大)会议召开|全球快消息
搜狐号-信息新报 2023-04-17
-
比例尺的应用题100道_比例尺的应用练习题 天天短讯
互联网 2023-04-17
-
儿童周围的面团圣诞装饰品应该使用哪种油漆?|天天观焦点
太平洋礼物网 2023-04-17
-
世界热消息:autd是什么意思
互联网内容整合 2023-04-17
-
申万宏源涨超6% 一季度归母净利同比增长87.77%至20.11亿元_世界热推荐
智通财经 2023-04-17
-
托福家考多久出分2023 全球要闻
新东方在线托福 2023-04-17
-
每日看点!《马力欧》北美次周拿下8700万美元,尼古拉斯凯奇“翻身”再度失败
Mtime时光网 2023-04-17
-
环球微动态丨2023年中国最受新锐企业家欢迎10大酱香型白酒品牌榜单
2023-04-17
-
非洲多国全力抗击霍乱疫情
人民网 2023-04-17
-
中国四川大竹百岛湖_中国四川大竹百岛湖|环球新动态
互联网 2023-04-17