Github最新5大开源机器学习项目!数据计算快至80倍!

作者: 钛灵创新 2020-03-17 10:21:27

 通过这5个具有挑战性的开源机器学习项目,正确地开始2020年的学习吧!这些机器学习项目涵盖了广泛的领域,包括Python编程和NLP。

Github最新5大开源机器学习项目!数据计算快至80倍!

越来越多的人正在寻找一种过渡到数据科学的方法。无论是应届大学毕业生,还是该行业相对较新的参与者,还是中级专业人员,还是只是对机器学习感到好奇的人,每个人都希望从数据科学中分一杯羹。

我挑选了5个开源机器学习项目(于2020年1月创建),让你熟悉最新的最新框架和库。 你会看到从自然语言处理(NLP)到Python编程的所有内容。

1、Reformer– PyTorch中的高效迁移

Transformer体系结构改变了自然语言处理(NLP)格局。 它催生了许多NLP框架,例如BERT,XLNet,GPT-2等。

Github最新5大开源机器学习项目!数据计算快至80倍!

但是有一个问题,我敢肯定,你们中的大多数都将与之相关–这些以变压器为动力的模型很大。 他们取得了最先进的结果,但价格太昂贵,超出了大多数想要学习和实施它们的人们的范围。该项目的作者提供了一个简单而有效的示例以及整个代码,以帮助您构建自己的模型。

2、PandaPy –最受欢迎的Python库

上周我发现了PandaPy,并且已经在我当前的项目中使用了它。 这是一个迷人的Python库,具有成为主流的巨大潜力。

如果您正在使用混合数据类型(int,float,datetime,str等)进行机器学习项目,则应尝试使用PandaPy而不是Pandas。 对于这些数据类型,它消耗的内存比Pandas少大约三分之一!

这是您会发现有趣的三个关键领域(我从PandaPy GitHub存储库中逐字逐句地总结了这些观点):

1)对于小型数据集(即加号,多号,对数)的简单计算,PandaPy比Pandas快25倍-80倍

2)对于小型数据集上的表函数(即组,枢纽,放置,连接,填充,填充),PandaPy比Pandas快5倍-100倍。

3)对于大多数使用小数据的用例,PandaPy比Dask,Modin Ray和Pandas快

3、Google Earth Engine – 300多个Jupyter笔记本可分析地理空间数据

多么出色的GitHub存储库! 我有很多有抱负的数据科学家在社交平台上与我联系,询问如何开始进行地理空间分析。 这是一个非常有趣的领域,提供了PB级的数据。 我们只需要一种结构化的方法来清理和分析它。这个惊人的资料库是300多个Jupyter笔记本的集合,其中包含使用Google Earth Engine数据的示例。

Github最新5大开源机器学习项目!数据计算快至80倍!

这些笔记本依靠三个Python库来执行代码:

  • Earth Engine Python API
  • Folium
  • Geehydro

GitHub存储库包含大量带有Python代码的示例,以帮助新手入门。

4、Automated Visual Analytics 自动化视觉分析

这是为新手提供的另一种高质量的数据可视化创意。 在没有任何实质性框架的情况下,使数据探索步骤自动化的想法已经浮出了一段时间。 Automated Visual Analytics 旨在使视觉分析由AI驱动和自动化。

Github最新5大开源机器学习项目!数据计算快至80倍!

5、Fast Neptune–加速机器学习项目

如今,无论是在研究领域还是行业中,可重复性都是任何机器学习项目的关键方面。 我们需要跟踪我们执行的每个测试,每个迭代,我们的机器学习模型的每个参数以及结果。

Fast Neptune库使我们能够快速记录启动机器学习实验所需的所有信息。 换句话说,Fast Neptune是您在阅读以上段落时可能会问到的可重复性问题的答案。

以下是Fast Neptune用来帮助我们进行快速实验的功能:

  • 有关运行代码的计算机的元数据,包括操作系统和操作系统版本
  • 运行实验的笔记本的要求
  • 体验期间使用的参数,表示要跟踪的变量的值的名称
  • 在运行期间要记录的代码

最先进的技术持续快速发展,对于新来者来说,如何跟上进度,势必会变得不知所措。stay hungry!

人工智能 机器学习 技术
上一篇:华为开源只用加法的神经网络:实习生领衔打造,效果不输传统CNN 下一篇:盘点技术对抗新冠病毒的十种方式
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

科技史上超炸组合「元宇宙+脑机接口」,离我们还有多远?

技术推进门槛很硬,资本市场敬而远之,伦理问题纠缠不清。脑机接口距离元宇宙还差了几个"VR元年"?

董子博 ·  1天前
芯片短缺对人工智能有多大伤害?

全球芯片短缺的影响随处可见:从家用电器价格上涨到消费电子设备产能受限。急需处理器的人工智能应用也正面临压力,不过SambaNova CEO表示,硬件本身并不是人工智能成功的决定性因素。

AI时代前沿 ·  1天前
2021年人工智能与自动化的发展趋势

自动化正在成为许多市场的首要任务,特别是随着远程工作的增长和劳动力短缺改变了传统的工作模式,很多企业转而采用更可持续的自动化解决方案。

Shelby Hiter ·  2天前
人工智能能否帮助金融行业有效应对勒索软件?

现在是金融机构安全意识进一步发展的时候了——这意味着要超越试图阻止勒索软件突破防火墙的预防性方法,专注于用能够检测和阻止攻击的工具武装自己。

Garry Veale ·  2天前
AI视频分析技术是如何工作的?原理是什么?

实时 AI 视频分析是一种基于人工智能的技术,可分析视频流以检测特定行为和事件的展开。这种类型的系统通过人工智能机器学习引擎检查来自监控摄像头的视频流来进行相关工作。该引擎使用一系列算法和程序来理解数据,并将数据转换为可理解的、有意义的信息。

EasyNVR ·  2天前
AI能成科学家的工具人?Nature采访五位顶尖学者:学会写代码,降低期望

AI 对于其他领域的科研来说是一个极其好用的工具,DNA测序、天文地理甚至艺术领域都必须要用到AI 模型来提供灵感。最近Nature 采访了五位跨领域的专家,听听他们对于AI 工具人有什么想法?

佚名 ·  2天前
人工智能与云计算正加速形成应用生态

人工智能在赋能生产力升级,推动各行业完成智能化转型和新旧动能转换的进程中发挥着重要作用。同时,人工智能技术也已经广泛应用在金融、教育、医疗、能源、消费、工业等各行业多场景之中。

佚名 ·  2天前
Facebook在ICCV 2021 发布两个3D模型,自监督才是终极答案?

在 ICCV 2021 上,Facebook AI提出了两个新模型3DETR和DepthContrast,这两个互补的新模型可促进3D理解并更容易上手。

佚名 ·  2天前
Copyright©2005-2021 51CTO.COM 版权所有 未经许可 请勿转载