谷歌大脑最新操作玩“复古”:不用卷积注意力,图像分类接近SOTA

作者: 佚名 2021-05-06 15:55:01

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

谷歌大脑的视觉Transformer团队(ViT),搞了个复古操作。

他们不用卷积神经网络(CNN)、也不用Transformer,仅凭最早的AI视觉任务采用的多层感知机(MLP)结构,就实现了接近SOTA的性能,更是在ImageNet图像分类任务上取得了87.94%的准确率。

谷歌大脑最新操作玩“复古”:不用卷积注意力,图像分类接近SOTA

这个架构名为MLP-Mixer,采用两种不同类型的MLP层,可以看做是一个特殊的CNN,使用 1×1卷积进行通道混合(按位操作),同时全感受野和参数共享的的单通道深度卷积进行字符混合(跨位操作)

在JFT-300M数据集上预训练、微调到224分辨率的Mixer-H/14版本取得了86.32%的准确率,比SOTA模型ViT-H/14仅低0.3%,但运行速度是其2.2倍

论文地址:
https://arxiv.org/abs/2105.01601

项目地址:
https://github.com/google-research/vision_transformer/tree/linen

谷歌 Android 开发
上一篇:AI智能语音识别算法 下篇 下一篇:做出电影级的 CG 渲染!斯坦福大学研究人员提出神经光图渲染
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

适合人工智能的九大编程语言

人工智能如今改变了几乎每个行业的运作方式。企业在开始实施一个项目之前,需要详细了解适合人工智能的编程语言。

李睿 ·  3天前
高级API、异构图:谷歌发布TF-GNN,在TensorFlow创建图神经网络

今天,TensorFlow 官方博客发布了 TensorFlow Graph Neural Networks(TensorFlow GNN)库 ,这个库使得用户在使用 TensorFlow 时能够轻松处理图结构数据。

机器之心报道 ·  2021-11-19 17:18:39
交大ACM班毕业生在Google的新工作:自动写Excel的表格公式

交大ACM班毕业生,伯克利博士陈昕昀在Google带来了她在ICML 2021的新工作,能够自动帮你补全公式,准确率在测试阶段已达57.4%。

佚名 ·  2021-11-03 11:02:19
开发人工智能需要哪些东西?

像很多事情一样,答案是“视情况而定”。如果我们将深度学习作为一个日益流行的人工智能的例子。

一起读资治通鉴 ·  2021-10-20 22:28:02
谷歌推出新AI工具 可识别常见皮肤状况

5月19日消息,据外媒报道,由于人工智能在医疗保健领域有多种用途,谷歌计划使用人工智能帮助用户了解更多常见的皮肤病。当与智能手机等技术相结合时,这种医学知识可以真正改善个人了解自身健康的方式。

Yu ·  2021-05-31 14:57:13
谷歌正在应用AI破解数据中心的下一代地热能

根据谷歌的说法,人工智能有望帮助解决这些问题,并开发出比目前世界各地部署的地热发电厂更高效、发电量更高的下一代地热发电厂。谷歌希望其在这一领域的投资将帮助公司实现到2030年为所有数据中心和办公室提供全天候无碳能源的目标。

佚名 ·  2021-05-25 14:36:47
谷歌推出新功能,利用 AI 工具拍照检测皮肤病

谷歌这项功能会展现每一个相匹配的皮肤状况,目前数据库中共有 280 种皮肤病的信息。此外,这个 AI 工具还是用了专业 CT 检查中用于检测糖尿病、肺癌的技术。

信鸽 ·  2021-05-19 10:10:11
谷歌人工智能实验室DeepMind将在加拿大招募研究人员

2014年被谷歌收购的位于伦敦的人工智能实验室DeepMind将其寻找世界上最好的人工智能研究人员的工作扩展到了加拿大多伦多。

Yu ·  2021-05-06 08:48:30
Copyright©2005-2021 51CTO.COM 版权所有 未经许可 请勿转载