VGG卷积神经网络模型解析

作者: gloomyfish 2019-01-05 08:40:17

一:VGG介绍与模型结构

VGG全称是Visual Geometry Group属于牛津大学科学工程系,其发布了一些列以VGG开头的卷积网络模型,可以应用在人脸识别、图像分类等方面,分别从VGG16~VGG19。VGG研究卷积网络深度的初衷是想搞清楚卷积网络深度是如何影响大规模图像分类与识别的精度和准确率的,最初是VGG-16号称非常深的卷积网络全称为(GG-Very-Deep-16 CNN),VGG在加深网络层数同时为了避免参数过多,在所有层都采用3x3的小卷积核,卷积层步长被设置为1。VGG的输入被设置为224x244大小的RGB图像,在训练集图像上对所有图像计算RGB均值,然后把图像作为输入传入VGG卷积网络,使用3x3或者1x1的filter,卷积步长被固定1。VGG全连接层有3层,根据卷积层+全连接层总数目的不同可以从VGG11 ~ VGG19,最少的VGG11有8个卷积层与3个全连接层,最多的VGG19有16个卷积层+3个全连接层,此外VGG网络并不是在每个卷积层后面跟上一个池化层,还是总数5个池化层,分布在不同的卷积层之下,下图是VGG11 ~GVV19的结构图:

考虑到整个网络的精简结构显示,ReLU激活函数并没有被显示在上述结构中。上述结构中一些说明:

  • conv表示卷积层
  • FC表示全连接层
  • conv3表示卷积层使用3x3 filters
  • conv3-64表示 深度64
  • maxpool表示***池化

上述VGG11 ~ VGG19参数总数列表如下:

 

在实际处理中还可以对***个全连接层改为7x7的卷积网络,后面两个全连接层改为1x1的卷积网络,这个整个VGG就变成一个全卷积网络FCN。在VGG网络之前,卷积神经网络CNN很少有突破10层的,VGG在加深CNN网络深度方面首先做出了贡献,但是VGG也有自身的局限性,不能***制的加深网络,在网络加深到一定层数之后就会出现训练效果褪化、梯度消逝或者梯度爆炸等问题,总的来说VGG在刚提出的时候也是风靡一时,在ImageNet竞赛数据集上都取得了不错的效果

 

在其他类似数据上同样表现不俗:

 

二:预训练模型使用(Caffe)

VGG本身提供了预训练模型供大家可以自由使用,预训练的VGG-16模型与VGG-19模型下载地址可以在这里发现:

https://www.robots.ox.ac.uk/~vgg/research/very_deep/

下载VGG-16模型之后使用OpenCV DNN模块相关API,就可以实现一个图像分类器,支持1000种图像分类,基于ImageNet 2014-ILSVRC数据集训练。原图:

 

VGG-16预测分类结果:

 

稍微有点尴尬的是,OpenCL初始化内存不够了,只能说我的机器不给力:

 

演示网络加载与图像分类的OpenCV程序代码如下:

  1. Net net = readNetFromCaffe(model_txt_file, model_bin_file); 
  2.     if (net.empty()) { 
  3.         printf("read caffe model data failure...\n"); 
  4.         return -1; 
  5.     } 
  6.     Mat inputBlob = blobFromImage(src, 1.0, Size(w, h), Scalar(104, 117, 123)); 
  7.     Mat prob; 
  8.     for (int i = 0; i < 10; i++) { 
  9.         net.setInput(inputBlob, "data"); 
  10.         prob = net.forward("prob"); 
  11.     } 
  12.     Mat probMat = prob.reshape(1, 1); 
  13.     Point classNumber; 
  14.     double classProb; 
  15.     minMaxLoc(probMat, NULL, &classProb, NULL, &classNumber); 
  16.     int classidx = classNumber.x; 
  17.     printf("\n current image classification : %s, possible : %.2f", labels.at(classidx).c_str(), classProb); 
  18.  
  19.     putText(src, labels.at(classidx), Point(20, 20), FONT_HERSHEY_SIMPLEX, 1.0, Scalar(0, 0, 255), 2, 8); 
  20.     imshow("Image Classification", src);  

学习OpenCV 深度学习视频教程 点击下面:

OpenCV深度学习模块 -《OpenCV 深度神经网络教程》

VGG 神经网络
上一篇:人工智能以及大数据将这样改变生活 下一篇:UNIT划重点—快速掌握对话系统技术原理
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

CPU比GPU训练神经网络快十几倍,英特尔:别用矩阵运算了

神经网络训练通常是 GPU 大显身手的领域,然而莱斯大学和英特尔等机构对 GPU 的地位发起了挑战。

机器之心 ·  2021-04-09 15:45:08
Facebook创造了两个会交流的神经网络来描述颜色

尽管人类世界拥有数千种语言,但是使用词语来表示不同颜色的方式是非常一致的。

佚名 ·  2021-03-30 17:16:44
美媒:人工智能发展五大趋势引期待

人工智能创新继续快速发展,几乎所有行业都出现了爆炸式增长。那么,过去一年里我们收获了什么?我们可以对2021年的人工智能发展有何期待?人工智能发展已经出现了五大趋势。预计这些趋势将在2021年变得更加突出。

参考消息 ·  2021-03-22 13:00:38
新型 AI 可以 “潜入人类大脑”,洞察什么容貌最吸引你

北京时间 3 月 11 日消息,据国外媒体报道,目前,科学家最新开发一种新型 AI 人工智能系统,它可以 “潜入人类大脑”,洞察哪些类型的面孔容貌最吸引你。

叶倾城 ·  2021-03-11 09:46:45
高颜值神经网络可视化:3D彩色、可定制,还能可视化参数重要性

最近,一款神经网络可视化工具火了。这款工具叫做「nn_vis」,它采用了新的3D可视化技术,可以呈现这样的效果。

子豪 ·  2021-03-08 09:25:48
Pytorch教程:新手的快速指南

今天,我们将帮助了解Pytorch如此流行的是什么,使用Pytorch的一些基础,并帮助您制作第一个计算模型。

闻数起舞 ·  2021-03-07 09:05:45
整个宇宙可能是个巨大的神经网络?科学家们是这样解释的

整个宇宙就是个神经网络,所有人类则是其中的节点?一脸震惊!

佚名 ·  2021-03-04 20:25:20
模型压缩6倍,无需重训练:数学家团队提出量化新方法

RUDN 大学的数学家团队找到一种新方法,该方法能够让神经网络的大小减小到六分之一,且无需花费更多的资源重新训练。

小舟 ·  2021-02-20 16:07:27
Copyright©2005-2021 51CTO.COM 版权所有 未经许可 请勿转载