IEEE论文提出径向变换实现图像增强

作者: 李亚洲 2017-09-04 15:43:00

超少量数据训练神经网络:IEEE论文提出径向变换实现图像增强

近日,一篇题为《Training Neural Networks with Very Little Data-A Draft》IEEE 论文提出了一种使用少量数据训练神经网络的新方法,即通过极坐标空间中的径向变换(radial transform) 实现图像增强。它并未改变数据的信息内容,而是改进了数据的多样性,并最终提升了神经网络的泛化表现。

论文地址:https://arxiv.org/pdf/1708.04347.pdf

摘要:深度神经网络是由许多节点层组成的复杂架构,结果导致大量需要在训练中评估的参数,包括权重、偏差等。相比于简单的架构,更大、更复杂的神经网络需要更多的训练数据满足适当的收敛。然而,可用于训练网络的数据要么有限、要么不均衡。我们提出在极坐标空间中的径向变换(radial transform) 进行图像增强,从而帮助数据较少的神经网络进行训练。每像素的坐标变换提供了原始图像与增强后的数据在极坐标系统中的表征,且又能增加表征较弱的图像类别的多样性。使用我们提出的方法,在 MNIST 上,以及使用 AlxNet、GoogLeNet 神经网络模型的一系列多模型医疗图像上的试验表现出了极高的分类准确率。

图 1:径向变换采样。a)使用径向变换从笛卡尔坐标系统(左)中把样本映射到极坐标系统(右)。b)极坐标系统中的径向变换。c)使用径向变换筛选 256 × 256 图像(2D 平面)中的离散样本。任意选定的极点在像素(170,50)处。d)把 c)中筛选的样本从极坐标系统映射到笛卡尔坐标系统。红色样本表明了样本从 c)到 d)的映射方向。

图 2 :来自 MNIST 数据集的样本和使用极坐标系中的径向变换 RT(·)的相应表征。

图 3:多模态医疗数据集的样本,以及在极坐标系统中使用径向变换的相应表征。

表 4:使用 MNIST 和医疗多模态数据集中的原始和径向变换图像训练的 AlexNet 和 GoogLeNet 模型的收敛行为。术语「RT」是指径向变换图像,术语「Original」是指用很少的原始图像训练的模型。x 轴表示训练迭代,左 y 轴表示训练时的模型损失,右 y 轴表示使用验证数据集训练时的模型准确度。

表 1:通过原始和径向变换的多模态医疗图像训练的 AlexNet 和 GoogLeNet 的准确度(「Acc.」in %)和置信度(「Conf.」in %)值。「Abd」是指腹部 MRI,「Std」是标准偏差。黑体部分是***结果。

表 2 :通过原始和径向变换的 MNIST 图像训练的 AlexNet 和 GoogLeNet 的准确度(「Acc.」in %)和置信度(「Conf.」in %)值。「Std」是标准偏差。黑体部分是***结果。

结论

成功地训练深度神经网络需要大量均衡的数据。在实践中,大部分数据集都是不均衡的,或者特定类别的数据集可用的数据有限。在此论文中,我们提出了极坐标系统中的径向变换来增加数据集中的样本量,从而帮助对神经网络的训练。提出的这种数据增强方法并未改变数据的信息内容,而是改进了数据的多样性。我们的结果显示这种方法增加了神经网络的泛化表现,也就是机器学习模型预测未知数据的输出值的准确率。在非常少的数据上训练当前***的 AlexNet 和 GooLeNet 神经网络模型,表明该方法在整个学习流程中训练损失和验证准确率都有极大的波动。

深度学习 神经网络 径向变换
上一篇:关于机器学习的傻瓜式指南 下一篇:深度学习可视化工具大盘点(附资源)
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

5分钟搭建强大又好用的深度学习环境

为深度学习项目建立一个良好的环境不是一件容易的任务。因为需要处理的事情太多了:库必须匹配特定的版本,整个环境需要可以复制到其他机器上,所有东西都需要能够机器中的所有驱动程序通信。这意味着你需要为你的NVIDIA GPU安装特定的驱动程序,并且CUDA库必须与你的驱动程序和你想要使用的框架兼容。

deephub ·  19h前
人工智能工具有助于在远程工作时提高团队的工作效率

人工智能技术不仅仅是用于远程连接,还用于监控和管理员工的工作,帮助部门经理跟踪和提高生产率。以下列出了人工智能在远程工作中提供团队工作效率的一些好处。

Sean Mallon ·  23h前
整个宇宙可能是个巨大的神经网络?科学家们是这样解释的

整个宇宙就是个神经网络,所有人类则是其中的节点?一脸震惊!

佚名 ·  1天前
人工智能在未来20年能做什么?

人工智能在几乎所有领域的部署程度值得赞赏。这个领域带来了如此多的机会,所以在未来几年里看到人工智能在各个方面的发展也就不足为奇了。

Cassie ·  1天前
2021关于人工智能的五大趋势

数字化变革,比过去10年更多,这主要是由于远程工作的规模,以及企业迅速部署了必要的技术,尤其是与网络安全相关的技术。那,2021关于人工智能的五大趋势会是如何的呢?

Lichu ·  2021-02-21 10:21:01
抛弃归一化,深度学习模型准确率却达到了前所未有的水平

我们知道,在传递给机器学习模型的数据中,我们需要对数据进行归一化(normalization)处理。

机器之心 ·  2021-02-20 21:09:12
无监督训练用堆叠自编码器是否落伍?ML博士对比了8个自编码器

柏林工业大学深度学习方向博士生 Tilman Krokotsch 在多项任务中对比了 8 种自编码器的性能。

Tilman Krokotsch ·  2021-02-20 20:57:16
模型压缩6倍,无需重训练:数学家团队提出量化新方法

RUDN 大学的数学家团队找到一种新方法,该方法能够让神经网络的大小减小到六分之一,且无需花费更多的资源重新训练。

小舟 ·  2021-02-20 16:07:27
Copyright©2005-2021 51CTO.COM 版权所有 未经许可 请勿转载