大数据、机器学习与深度学习类命令行工具汇总

编译作者: 核子可乐译 2017-02-15 10:01:49

【51CTO.com快译】抓紧你的键盘!无需鼠标或者GUI,我们完全能够在OS X与Linux上完成大量操作。面向各类*N*X系统的大量出色命令行工具一直在技术行业拥有极高人气,且已经扩展至Python、Go、NodeJS乃至各类混合型工具当中。即使大家并不打算通过命令行运行整条数据处理管道,这些工具仍然能够带来可观助益。

《命令行上的数据科学(Data Science at the Command Line)》一书与GitHub皆为我们带来大量高水平的预处理与后处理类工具选项,大家亦可根据需要对其进行针对性调整。在今天的文章中,我将向各位强烈推荐自己最为喜爱的那些相关工具。

CSVKit绝对值得一试。其能够利用逗号分隔值实现您所需要的一切。大家可以通过cvs cut剪切列、使用cvsgrip进行列过滤、通过sql2csv将PostgreSQL中的数据提取至CSV、使用cols从列中剪切子集并通过in2cv将微软Excel转换为CSV。

快速工具推荐清单

大家亦可以编写简短的Python脚本以通过命令行实现数据处理。

  1. from nltk.sentiment.vader 
  2. import SentimentIntensityAnalyzer 
  3. import sys 
  4. sid = SentimentIntensityAnalyzer() 
  5. ss = sid.polarity_scores(sys.argv[1]) 
  6. print('Compound {0} Negative {1} Neutral {2} Positive {3} '.format(ss['compound'], ss['neg'], ss['neu'], ss['pos'])) 

只需要五行Python脚本即可实现情绪分析。

大家甚至可以通过命令行实现TensorFlow调试(不过其目前尚处于beta测试阶段,所以可能会出现一些问题)。

原文标题:Big Data, Machine Learning, and Deep Learning Command Line Tools

原文作者:Tim Spann

【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】

大数据 机器学习 深度学习
上一篇:反面观点:我们不该急于投身AI的五个理由 下一篇:要用无人驾驶卡车送货?亚马逊申请无人驾驶专利
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

人工智能能否使机器具有流体智力?

麻省理工学院和奥地利研究人员为灵活的人工智能创造了“液体”机器学习。

千家网 ·  2021-06-01 10:38:55
高真实感、全局一致、外观精细,面向模糊目标的NeRF方案出炉

自 NeRF 被提出后,有多项研究对其加以改进。在本篇论文中,上海科技大学的研究者提出了首个将显式不透明监督和卷积机制结合到神经辐射场框架中以实现高质量外观的方案。

Haimin Luo等 ·  2021-06-01 09:57:39
大脑模拟NLP,高德纳奖得主:神经元集合演算用于句子解析

一个简单的大脑模型为人工智能研究提供了新的方向。世界顶尖计算机科学理论学家、哥德尔奖和高德纳奖获得者、哥伦比亚大学计算机科学教授 Christos Papadimitriou 关于「大脑中单词表征」的演讲。

Ben Dickson ·  2021-06-01 09:39:24
打破“维度的诅咒”,机器学习降维方法好

机器学习算法因为能够从具有许多特征的数据集中找出相关信息而大火,这些数据集往往包括了几十行的表格或者数百万像素的图像。

水木番 ·  2021-05-31 09:41:17
工业界中的机器学习是什么样子的

本文结合作者十余年的工业界经历,从工业界的视角来尝试给些思考和总结,欢迎大家批评讨论。

龙星镖局 ·  2021-05-31 09:26:01
AI时代,需要发挥知识图谱+知识管理的双轮价值

AI时代,需要发挥知识图谱+知识管理的双轮价值,才能真正实现从流程驱动、数据驱动走向知识驱动。

东方林语 ·  2021-05-31 09:15:14
人工智能是如何改变日常商业运作的?

人工智能的使用也改变了我们如今开展业务的方式。从平凡的任务到数据分析,该技术使公司能够保持竞争优势。此外,使用AI可以改善个性化的客户体验以及改善风险管理。

佚名 ·  2021-05-28 17:24:32
最喜欢随机森林?TensorFlow开源决策森林库TF-DF

近日,TensorFlow 开源了 TensorFlow 决策森林 (TF-DF)。TF-DF 是用于训练、服务和解释决策森林模型(包括随机森林和梯度增强树)生产方面的 SOTA 算法集合。

机器之心 ·  2021-05-28 17:18:44
Copyright©2005-2021 51CTO.COM 版权所有 未经许可 请勿转载