一个AI算法就能代替手机图像处理器,让手机拍出单反味儿

作者: 晓查 2020-02-28 10:26:26

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

拍照已经是手机最大的卖点,各大厂商在DxO上刷分刷得不亦乐乎,一亿像素、超级夜景、光学变焦……花样越来越多。

一个AI算法就能代替手机图像处理器,让手机拍出单反味儿

然而不同手机拍出来的质感却不一样,一方面是镜头模组不同,另一方面是对图像处理器(ISP)的软件调教也不同。

最近,苏黎世联邦理工学院(ETHZ)提出一个新的算法PyNet,只需单个端到端深度学习模型,就能替代手机的ISP。

它调教出的相机算法可以从一个手机移植到另一个手机上,而不必使用手机的ISP。即使两款手机芯片来自两家厂商,也完全没问题。

用华为P20和佳能单反相机5D Mark IV调教的算法,移植到黑莓手机KeyOne上,照片质量与原始ISP输出相比,有了很大的改善。

一个AI算法就能代替手机图像处理器,让手机拍出单反味儿

华为P20使用的是麒麟970芯片+1200万像素索尼IMX 380摄像头,黑莓KeyOne使用的是骁龙625+1200万像素索尼IMX 378摄像头。

目前,PyNET的源代码、数据集、预训练模型都已经在GitHub上发布了。

PyNET原理

我们按下快门后,手机在不到一秒时间里就输出了一幅图片,背后过程却相当复杂。

手机拍照时,首先输出的是原始不带任何修饰的感光信息文件RAW。

RAW经过手机SoC中专门用于运算图像的ISP经过一系列处理,将原本暗淡的原始图像变成艳丽的结果。

这其中的过程包括:去除噪点、修正白平衡、调整曝光量、校正色彩对比度、超分辨率等等。

现在,越来越多的手机开始用上NPU等AI核心,AI运算能力越来越强,未来是否可以用NPU来代替ISP做图像运算呢?这就是ETHZ研究人员的思路。

研究人员首先采集2万张华为P20拍摄的RAW原始图片,和同样场景下Canon单反5D Mark IV拍摄的照片,以此作为数据集进行训练。

但是训练过程中并没有使用原尺寸的图片,而是448×448的窗口从图片上选取一部分,最后 产生了48043个RAW-RGB图像对。

一个AI算法就能代替手机图像处理器,让手机拍出单反味儿

为了能够把较小尺度上训练的结果用于原尺寸图片上,PyNET采用了分级的架构。

以下就是PyNET的网络架构,该模型具有倒金字塔形状,能以五个不同的级别处理图像。

PyNET架构具有多个块,这些块与不同大小的卷积滤波器(从3×3到9×9)并行处理特征图,然后将相应的卷积层的输出进行级联。

一个AI算法就能代替手机图像处理器,让手机拍出单反味儿

在较低尺度下获得的输出将通过转置的卷积层进行上采样,与高级的特征图堆叠在一起,然后在随后的卷积层中进行处理。

PyNET从最低层开始,对模型进行顺序训练。先在较低尺度上获得良好的图像重建结果,用于处理分辨率非常低的图像并执行全局图像操作。

对底层进行预训练之后,再将相同的步骤应用于下一个级别,直到对原始分辨率图像进行训练为止。

由于每个较高级别都从模型的下部获得了高级的高质量特征,因此它主要学习重建缺失的低级细节并完善结果。

经过训练后,将华为P20拍摄的RAW原始图像交给PyNET处理,图片不输华为自带ISP的处理效果。

一个AI算法就能代替手机图像处理器,让手机拍出单反味儿

在Amazon Mechanical Turk平台上的人工打分显示,用PyNet处理的图片观感优于P20直出效果。

一个AI算法就能代替手机图像处理器,让手机拍出单反味儿

安装和训练

PyNET用TensorFlow实现,需要安装SciPy、NumPy、imageio和pillow,英伟达GPU也是必不可少的,因为训练过程中需要用到CUDA和cuDNN。

此外还需要下载预训练的VGG-19、PyNet模型,以及RAW-RGB图像对数据集。

作者推荐模型在具有16GB显存的Tesla V100 GPU上进行训练。

如果你没有强大的计算资源,也可以利用开源代码中的dng_to_png.py将RAW转换为PNG格式图片,不过你用的就是官方P20和佳能单反的调教结果了。

论文地址:https://arxiv.org/abs/2002.05509

源代码:https://github.com/aiff22/PyNET

AI 数据 人工智能
上一篇:一个Bug损失200亿!如何搭建业务异常检测系统? 下一篇:2020年中国智能物联网(AIoT)白皮书
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

在工厂中实施工业物联网技术的5个理由

虽然有许多原因,但以下五个因素正在推动更多公司在其工厂中实施工业物联网解决方案。

Mark Cox ·  1天前
我们对人工智能的误解有多深

人工智能技术具有正、反两方面的作用,在造福于人类的同时,也存在各种风险。理论上可能存在以下四种风险。

陈小平 ·  1天前
令人兴奋的 2020 年人工智能和机器学习趋势

在本文中,我们将讨论几个顶级的人工智能和机器学习趋势,将塑造新年:2020。 我们还将介绍面部识别技术及其在2020年的应用。

飞羽译 ·  1天前
体验中国自主知识产权天元深度学习引擎与TensorFlow,PyTorch的对比

深度学习驱动之下最早创业的中国AI独角兽旷视,宣布开源自研深度学习框架MegEngine(Brain++核心组件之一),中文名天元——取自围棋棋盘中心点的名称。

尹成 ·  1天前
高科技:美国开发远程人脸识别系统 实现1公里内目标识别

来自外媒消息,近日,在《新科学》杂志刊登了一篇报道:美国军方正在开发一种便携式人脸识别设备,能够识别一公里外的目标。

城池 ·  1天前
如何通过AIOps将智能注入IT运营

试图更好地监控IT资产的组织正在转向人工智能,以便在性能问题出现之前解决掉,并在感受到负面影响之前自动将其修复。

Maria Korolov ·  1天前
跨物种造物,AI将长颈鹿图片转换为鸟,还骗过了人类与机器

当人们研究人工智能生成和检测图像的方式时,都需要明确一个研究主题。近期康奈尔大学的三位研究人员 Daniel V. Ruiz,Gabriel Salomon,Eduardo Todt 决定训练人工智能将长颈鹿的图片转化成鸟的图片。

陈伊莉 ·  1天前
大数据与AI如何助力食品饮料行业发展?

数字化几乎颠覆了每一个行业,从金融服务到医疗保健,而食品和饮料行业也不例外。从历史上看,风味特点、潮流和新的食品主要归功于厨师和产品开发人员。而在将一个创意转化成产品并推向市场之前,可能需要花费几个月甚至是几年的时间。

至顶网 ·  2天前
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载