吴思楠机器学习之路:Numpy里多维数组的创建

作者: 吴思楠 2017-04-14 15:28:27

Numpy是Python科学计算的核心库之一,主要提供了对多维数组的强有力支持。

什么是多维数组?

核心对象是同型的多维数组(简单理解就是一个表格,通常内容都是些数字),具有相同的数据类型。

概念:

1. axes(轴):数组的维度统称为轴。

2. rank:轴的数量称为rank。

举例:一维数组[1,2,1],就是一个rank为1的数组,因为它只有一个轴(一维)。下图显示的是一个rank为2(二维)的数组。它的***个轴(维)的长度是2,如红色线框所示;第二个轴(维)的长度是3,如蓝色线框所示。这个有点像数据结构里说的:数组的元素本身也可以是数组类型一样,***扩展下去。

Numpy里的多维数组:ndarray

Numpy的数组类numpy.array一般称呼为ndarray,这么叫主要是为了和Python的数组类array.array区分开来。后面的文章里,如无特殊说明的地方,array和ndarray均是指的numpy.array。

ndarray(numpy.array)的主要属性:

  • ndim:数组的轴数(维度)
  • shape:python的元组类型,其中每个数字分别表示的是各个轴(维)上数组的长度
  • size:多维数组里全部元素的总数(等于shape元组里所有数值的乘积)
  • dtype:多维数组里元素的类型。同一个多维数组里所有的元素都是同一种类型

这里插播一下:

Anaconda是一个基于Python的Data Science Platform,相当于一个包装了数据分析常用库和工具的软件。它是我们开始学习的一个好帮手。下载地址:https://www.continuum.io/anaconda-overview

安装好后,打开“IPython”,或者“Jupyter QtConsole”,或者“Spyder”都可以。它们本质上都是对IPython这个交互式环境的包装。

练习:创建一个ndarray。

直接使用numpy.array()方法,参数为python的 list or tuple (sequence type)。下面的代码里,“In”是我们输入的代码,“Out”是上一行代码的输出。不是每一行代码都会有输出哦。

代码:

下面这张图是在“Spyder”里执行上面代码的效果图:

双击上图中的变量查看窗口(Variable explorer)里的ndarray,可以看到一个二维数组的展示图:

创建ndarray的一些其它方法

1. zeros,ones和empty方法

  • numpy.zeros
  • numpy.ones
  • numpy.empty

numpy提供了另外一种快速创建ndarray的方法,尤其适合数组内容未知的情况,同时也避免了数组增长过程中的开销

2. arange方法

arange可以返回一个平均分布的ndarray(numpy.array)。可以分别设置开始(可选),结束(必填)和间距(可选)。下面的示例非常清楚的展示了该方法的使用。

3. reshape方法

顾名思义,此方法是将一个已经存在了的ndarray,转换为另外一个shape(形状,即数组各个轴上的长度)的多维数组。新数组包含了原来所有的数据。

注意:新的形状必需保持size相同,直白一点,就是***个shape的参数,3x4=12,需要和第二个shape的参数2x6=12,始终保持一致。

4. random方法

用随机数填充新数组的内容。numpy里有多个产生数据数组的方法,容易搞晕。产生随机数目前我见到两大类,一类是按照“均匀分布”(例如概率论里的“0-1连续分布”)产生,另一类是按照“正态分布”产生的。

在numpy里,我们会见到random,ranf,sample这几个方法,其实它们全部都是:

numpy.random.random_sample这个方法的别名,都是基于“均匀分布”产生随机数。下面的代码验证了这一点:

详细介绍下用的最多一个:

numpy.random.random

API:https://t.im/1b9sw

它随机返回半开区间[0.0, 1.0)的浮点数,方法参数只有一个:

size : int或者int型元组,同时也作为返回数组的shape。如果输入的是(2,3,5),则首先抽取2x3x5=30个随机数,然后形成一个形状为(2,3,5)的多维数组作为返回值。如果没有提供参数,则直接返回一个随机数。

练习:生成[12, 30)区间的一个6x3的数组

代码:

好了,关于numpy第1讲就到这里,还有很多内容待后面用到的时候又再介绍。

【本文为51CTO专栏作者“吴思楠”的原创稿件,转载请通过51CTO联系作者获取授权】

戳这里,看该作者更多好文

1-Numpy 基础 多维数组
上一篇:深度学习概述:从感知机到深度网络 下一篇:Spark for python developers —Spark与数据的机器学习
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

AI技术将如何推动制药行业发展?

从目前来看,AI技术的应用范围已经非常广泛,各个行业可谓概莫能外——制药行业自然也在其中。这一切,将给制药这一历史悠久且至关重要的行业带来前所未有的变革。

佚名 ·  15h前
疫情期间都用上哪些热点技术?AI、5G、RTC,大数据纷纷登场

2020年这场突入其来的疫情,在AI、5G、RTC、大数据等科技技术的帮助下,从技术和数据的维度对疫情期间的预警、防控、追踪起到了非常重要的作用。

允中 ·  19h前
2020年搞深度学习需要什么样的GPU:请上48G显存

在 lambda 最新的一篇显卡横向测评文章中,开发者们探讨了哪些 GPU 可以再不出现内存错误的情况下训练模型。当然,还有这些 GPU 的 AI 性能。

机器之心 ·  19h前
Excel狂魔?单元格做计算机视觉:人脸检测、OCR都不在话下

计算机视觉是什么?过于专业,一步劝退?在普通人看来,计算机视觉是软件开发者才能涉足的领域,需要用到很多专业的框架,普通人只能围观。但 GitHub 上的一个项目似乎颠覆了我们的认知。

佚名 ·  20h前
5项人工智能实例,令人惊叹

为了让人工智能成为主流,科学家和研究人员付出了更多的努力。正因如此,这项独创性技术不仅已经融入了人们的日常生活,而且持续影响着多个行业。人工智能是一种不可忽视的力量,从Siri和Alexa这样的语音驱动私人助理到自动驾驶汽车,它一直在不断发展。

读芯术 ·  20h前
独家下载!阿里如何用 AI 写代码?

作为今年阿里经济体前端委员会的四大技术方向之一,前端智能化方向一被提及,就不免有人好奇:前端结合 AI 能做些什么,怎么做,未来会不会对前端产生很大的冲击等等。本篇文章将围绕这些问题,以「设计稿自动生成代码」场景为例,从背景分析、竞品分析、问题拆解、技术方案等几个角度切入,细述相关思考及过程实践。

妙净、波本 ·  21h前
带有面部识别的口罩可解锁 iPhone ,网友:duck 不必

近日,产品设计师 Danielle Baskin 发布了一款带有面部信息的口罩,让人们带着口罩也能用 Face ID 解锁手机。

刘琳 ·  23h前
人工智能在网络安全运维服务中的应用

近年来,国内外网络安全形势趋于复杂,关系到国民经济命脉的关键信息基础设施在传统模式下得不到有效保护。

信息安全与通信保密 ·  1天前
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载