为什么你觉得Matplotlib用起来困难?因为你还没看过这个思维导图

作者: 机器学习与数据分析 2020-01-22 16:29:52

 前言

Matplotlib是一个流行的Python库,可以很容易地用于创建数据可视化。然而,设置数据、参数、图形和绘图在每次执行新项目时都可能变得非常混乱和繁琐。而且由于应用不同,我们不知道选择哪一个图例,比如直方图,饼状图,曲线图等等。这里有一个很棒的思维导图,可以帮助您为工作选择正确的可视化效果:

为什么你觉得Matplotlib用起来困难?因为你还没看过这个思维导图

我们对于这张思维导图中的主要图例做一些解释:

散点图

散点图非常适合显示两个变量之间的关系,因为您可以直接看到数据的原始分布。您还可以通过如下图所示的对组进行颜色编码来查看不同数据组的这种关系。

为什么你觉得Matplotlib用起来困难?因为你还没看过这个思维导图

想要可视化三个变量之间的关系吗?!完全没有异议只需使用另一个参数(如点大小)对第三个变量进行编码,如下面的第二个图所示,我们把这个图叫做冒泡图。

为什么你觉得Matplotlib用起来困难?因为你还没看过这个思维导图

散点图函数举例:

  1. scatter(x_data,y_data,s=10,color=color,alpha=0.75

线图

当你能清楚地看到一个变量与另一个变量之间变化很大时,最好使用线图。让我们看看下面的图来说明。我们可以清楚地看到,所有专业的百分比随时间变化很大。用散点图来绘制这些图会非常杂乱,很难真正理解和看到发生了什么。直线图非常适合这种情况,因为它基本上可以快速总结两个变量(百分比和时间)的协方差。同样,我们也可以通过颜色编码来使用分组。

为什么你觉得Matplotlib用起来困难?因为你还没看过这个思维导图

线图代码举例:

  1. plot(x_data, y_data, lw = 2, color = '#539caf', alpha = 1

直方图

直方图对于查看(或真正发现)数据点的分布很有用。看看下面的柱状图,我们绘制了频率和智商的柱状图。我们可以清楚地看到向中心的浓度和中值是什么。我们也可以看到它遵循一个高斯分布。使用条形图(而不是散点图)可以让我们清楚地看到每个箱子频率之间的相对差异。使用箱子(离散化)真的帮助我们看到“更大的画面”,如果我们使用所有没有离散箱子的数据点,在可视化中可能会有很多噪音,使我们很难看到到底发生了什么。

为什么你觉得Matplotlib用起来困难?因为你还没看过这个思维导图

假设我们要比较数据中两个变量的分布。有人可能会认为,你必须制作两个独立的直方图,把它们放在一起比较。但是,实际上有一个更好的方法:我们可以用不同的透明度覆盖直方图。看看下面的图。均匀分布的透明度设为0。5这样我们就能看到它的背后。这允许使用直接查看同一图上的两个分布。

为什么你觉得Matplotlib用起来困难?因为你还没看过这个思维导图

直方图代码举例:

  1. hist(data, n_bins = n_bins, cumulative = cumulative, color = '#539caf'

条形图

当您试图将类别很少(可能少于10个)的分类数据可视化时,条形图是最有效的。如果我们有太多的类别,那么图中的条形图就会非常混乱,很难理解。它们非常适合分类数据,因为您可以根据条形图的大小;分类也很容易划分和颜色编码。我们将看到三种不同类型的条形图:常规的、分组的和堆叠的:

为什么你觉得Matplotlib用起来困难?因为你还没看过这个思维导图

常规的条形图代码举例:

  1. bar(x_data, y_data, color = '#539caf', align = 'center'
为什么你觉得Matplotlib用起来困难?因为你还没看过这个思维导图

分组图代码举例:

  1. foriinrange(0,len(y_data_list)):    if i == 0:        bar(x_data,y_data_list[i],color=colors[i],align='center',label=y_data_names[i])else:  bar(x_data,y_data_list[i],color=colors[i],bottom=y_data_list[i-1],align='center',label=y_data_names[i]) 
为什么你觉得Matplotlib用起来困难?因为你还没看过这个思维导图

堆叠图代码举例:

  1. for i in range(0, len(y_data_list)):bar(x_data+alteration[i],y_data_list[i],color=colors[i],label=y_data_names[i],width=ind_width) 
机器学习 人工智能 计算机
上一篇:性能提升25倍:Rust有望取代C和C++,成为机器学习首选的Python后端 下一篇:阿里开源MNNKit:基于MNN的移动端深度学习SDK,支持安卓和iOS
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

AI人工智能正在悄悄的操控着我们的所见所想

在日常生活中大家现在已经越来越依赖手机上各种形形色色的app了,无论我们是出门吃饭时寻找餐厅,还是在视频语音聊天,刷视频,或是网上购物shopping,无时无刻我们都离不开手机APP。

软件说明 ·  18h前
AI 崛起的第九个年头,还有哪些大有可为的地方?

2020年还剩下10个月的时间,让我们去预期,人工智能会有哪些重要的趋势呢? CB insights曾就此问题做了一个判断,并给出人工智能的九个重要研究和应用趋势。AI 科技评论在一定程度上认同这些判断,针对这 9 个趋势,我们将做以下分析。

蒋宝尚 ·  19h前
AI芯片为啥至今都没有出现“爆款”?

“AI芯片”这个新鲜的概念在过去一年间逐渐走过了普及的阶段,越来越被大众所熟知。在行业走过野蛮生长,开始加速落地、加速整合的过程中,也有更多的AI芯片公司也开始走出属于自己的差异化路线。

佚名 ·  19h前
拥有30亿张照片库的人脸识别初创公司遭黑客攻击!600多家执法机构和银行信息被盗

Clearview AI是美国纽约的一家AI面部识别创业公司Clearview设计的一款突破性的面部识别应用工具,通过拍摄陌生人的照片,然后将其上传,就可以轻松查看该人的公开照片,以及指向这些照片出现位置的链接和具体内容。

张佳、王汐 ·  19h前
数据机器学习在故障检测中的应用

本文将简要介绍几种在故障诊断领域广泛应用的机器学习技术及其各自的应用方向,并对每种技术的优缺点进行简单分析。包括:贝叶斯网络(BN),人工神经网络(ANN),支持向量机(SVM)和隐马尔可夫模型(HMM)技术。

交能网 ·  20h前
人工智能如何改造旅游业

旅游业正在慢慢地将人工智能融入到行业当中,并为游客提供个性化定制体验。在人工智能的帮助下,旅游业的业务流程和客户服务都发生了改变。

佚名 ·  1天前
人工智能技术如何将人们从深度伪造的世界中拯救出来

如今,采用深度伪造(Deepfake)生成的视频和音频,人工智能生成的文本、诗歌和歌词,假网站和假新闻进入人们的世界。人们的生活还会真实吗?

Mike Elgan ·  1天前
四种使用物联网和人工智能加速获取价值的有效方法

最近,话题转向企业如何才能更快,更有效地获取和利用物联网计划的见解。物联网和人工智能的结合为企业实现这一预期成果提供了途径。实际上,这两种技术是相辅相成的,应该紧密相连。

佚名 ·  2天前
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载