深度学习必懂的13种概率分布

作者: 佚名 2020-01-15 15:35:40

作为机器学习从业者,你需要知道概率分布相关的知识。这里有一份最常见的基本概率分布教程,大多数和使用 python 库进行深度学习有关。

概率分布概述

  • 共轭意味着它有共轭分布的关系。

在贝叶斯概率论中,如果后验分布 p(θx)与先验概率分布 p(θ)在同一概率分布族中,则先验和后验称为共轭分布,先验称为似然函数的共轭先验。共轭先验维基百科在这里(https://en.wikipedia.org/wiki/Conjugate_prior)。

  • 多分类表示随机方差大于 2。
  • n 次意味着我们也考虑了先验概率 p(x)。
  • 为了进一步了解概率,我建议阅读 [pattern recognition and machine learning,Bishop 2006]。

分布概率与特征

1.均匀分布(连续)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/uniform.py

均匀分布在 [a,b] 上具有相同的概率值,是简单概率分布。

 

2.伯努利分布(离散)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/bernoulli.py

  • 先验概率 p(x)不考虑伯努利分布。因此,如果我们对最大似然进行优化,那么我们很容易被过度拟合。
  • 利用二元交叉熵对二项分类进行分类。它的形式与伯努利分布的负对数相同。

3.二项分布(离散)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/binomial.py

  • 参数为 n 和 p 的二项分布是一系列 n 个独立实验中成功次数的离散概率分布。
  • 二项式分布是指通过指定要提前挑选的数量而考虑先验概率的分布。 

4.多伯努利分布,分类分布(离散)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/categorical.py

  • 多伯努利称为分类分布。
  • 交叉熵和采取负对数的多伯努利分布具有相同的形式。 

5.多项式分布(离散)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/multinomial.py

多项式分布与分类分布的关系与伯努尔分布与二项分布的关系相同。

6.β分布(连续)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/beta.py

  • β分布与二项分布和伯努利分布共轭。
  • 利用共轭,利用已知的先验分布可以更容易地得到后验分布。
  • 当β分布满足特殊情况(α=1,β=1)时,均匀分布是相同的。 

7.Dirichlet 分布(连续)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/dirichlet.py

  • dirichlet 分布与多项式分布是共轭的。
  • 如果 k=2,则为β分布。 

8.伽马分布(连续)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/gamma.py

  • 如果 gamma(a,1)/gamma(a,1)+gamma(b,1)与 beta(a,b)相同,则 gamma 分布为β分布。
  • 指数分布和卡方分布是伽马分布的特例。 

9.指数分布(连续)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/exponential.py

指数分布是 α 为 1 时 γ 分布的特例。


10.高斯分布(连续)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/gaussian.py

高斯分布是一种非常常见的连续概率分布。 

11.正态分布(连续)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/normal.py

正态分布为标准高斯分布,平均值为 0,标准差为 1。

12.卡方分布(连续)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/chi-squared.py

  • k 自由度的卡方分布是 k 个独立标准正态随机变量的平方和的分布。
  • 卡方分布是 β 分布的特例

13.t 分布(连续)

代码:https://github.com/graykode/distribution-is-all-you-need/blob/master/student-t.py

t 分布是对称的钟形分布,与正态分布类似,但尾部较重,这意味着它更容易产生远低于平均值的值。

 

深度学习 人工智能 概率分布
上一篇:12个现实世界中的机器学习真相 下一篇:人工智能如何判断客户的个性?
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

AI技术将如何推动制药行业发展?

从目前来看,AI技术的应用范围已经非常广泛,各个行业可谓概莫能外——制药行业自然也在其中。这一切,将给制药这一历史悠久且至关重要的行业带来前所未有的变革。

佚名 ·  17h前
2020年搞深度学习需要什么样的GPU:请上48G显存

在 lambda 最新的一篇显卡横向测评文章中,开发者们探讨了哪些 GPU 可以再不出现内存错误的情况下训练模型。当然,还有这些 GPU 的 AI 性能。

机器之心 ·  21h前
5项人工智能实例,令人惊叹

为了让人工智能成为主流,科学家和研究人员付出了更多的努力。正因如此,这项独创性技术不仅已经融入了人们的日常生活,而且持续影响着多个行业。人工智能是一种不可忽视的力量,从Siri和Alexa这样的语音驱动私人助理到自动驾驶汽车,它一直在不断发展。

读芯术 ·  21h前
带有面部识别的口罩可解锁 iPhone ,网友:duck 不必

近日,产品设计师 Danielle Baskin 发布了一款带有面部信息的口罩,让人们带着口罩也能用 Face ID 解锁手机。

刘琳 ·  1天前
人工智能在网络安全运维服务中的应用

近年来,国内外网络安全形势趋于复杂,关系到国民经济命脉的关键信息基础设施在传统模式下得不到有效保护。

信息安全与通信保密 ·  1天前
与时间赛跑!AI是疾病基因分析和诊断的加速器

最快速的了解新的病毒带来的病例成因早日实现对症下药,成为打赢“抗疫”的关键。今天AI等新技术在积极发挥着作用。

佚名 ·  1天前
未来五年内适合从事的5个工作领域

你可曾听过“中国制造2025”即中国要在2025年完成一次产业的彻底彻底升级,提升中国制造业彻底从劳动密集型产业改变为智慧密集型的产业。通过人工智能,大数据分析等技术,彻底突破中等收入陷阱,加速步入发达国家行列。

大潘老师 ·  1天前
如何避免又一个AI寒冬?

尽管过去几年中,人工智能取得了长足的进步,但相信很多人都还记得20世纪90年代,由于开发者过分夸大承诺以及最终用户不切合实际的期望所导致的AI寒冬。

佚名 ·  1天前
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载