AI公开课 | 我猜你对数据标注还不了解吧?

作者: 班主任 2019-12-11 15:36:23

 毋庸置疑的是,人工智能领域每天都在上演着日新月异的发展和进步。

当我们打开手机,启用美颜APP里各种各样的AI滤镜时,我们看到的是搞笑的头像和可爱的表情,而APP“看到”的是我们脸上数百个点。

我们早已对各类的AI滤镜习以为常,但却甚少思考这些APP究竟是怎样识别出哪里是眼睛,哪里是鼻子。

其实这一切都归功于AI时代最可爱却最容易被忽视的一群人,他们就是被称为人工智能“老师”的数据标注员

人工智能背后的人工

早上8点30分,小新打开了名为“数据标注分配任务群”的QQ群,开始了一上午的工作。

AI公开课 | 我猜你对数据标注还不了解吧?

群主早已将今天需要标注的视频和图片发到群里,小新被分配到的是一段长达3个小时的视频录像。

这是一段某口腔医学院老师讲课时录制的视频,视频的内容主要是针对口腔龋齿的介绍分类,小新的主要任务就是在视频中找到黑色的龋齿,然后用鼠标将龋齿周围画一个数字“边界线”,从而将它标注出来。

同样的动作小新一上午要重复几百次,直到视频播放结束,最后小新会将标注好的新视频重新反馈到群里,结束一上午的工作。

小新并不是医学专业出身,他也不太清楚这些被标注的龋齿部分到底有何作用。但在无形之中小新却成了人工智能医疗系统的“老师”,通过大量的数据迭代让AI可以准确识别出哪些是龋齿,龋齿腐烂的程度等。

小新或许从没听说过“数据标注”这个职业,但他却用实际行动日复一日履行着一个数据标注员的责任,让机器通过大量的资料学习,直到它们顺利“毕业”。

 

大浪潮之下的普通人

近2年数据标注公司开始在国内大规模兴起,这与中国人工智能发展初期所需要的大量的数据密不可分。

由于科技公司所需要的数据量巨大,数据标注公司会把很大一部分标注工作分包出去,数据浪潮让AI更智能的同时也带来了大量的就业机会。

在距离贵阳市中心50公里的百鸟河数字小镇,就有一个规模500人的“数据工场”,500名标注员中,近一半是附近一家扶贫高职的学生。

据了解,他们一个月能挣到1500元,经济上足以自立,还能补贴家用,相比餐厅辛苦端盘子或者送外卖这类兼职工作,数据标注相对轻松且体面。

AI公开课 | 我猜你对数据标注还不了解吧?

扶贫高职学生进行数据标注工作

数据浪潮的滚滚洪流席卷着资金和技术,裹挟着无数梦想与野心向前奔腾,在资本和野心之下无数普通人虽然暂时不理解这些变化,但却能从变化中获得便捷和利益。

关于我们不知道的故事

对于绝大部分同学来说“数据标注”是一个陌生又专业的名词,班主任也是第一次和大家提起这方面的知识。其实围绕数据标注还有很多有意思的话题,比如数据标注的分类,数据标注产业的发展和影响,数据标注到底是不是完全依赖人类…..

为了让大家更深入更全面的了解数据标注,AI大学第26期科技晚自习特意邀请到了科大讯飞AI资源部语音数据主管刘丹,在12月12日晚19点来到AI大学直播间和同学们一起聊聊关于数据标注背后的故事。

【课程主题】

一个未被讲出的故事——数据标注

【课程讲师】

科大讯飞AI资源部语音数据主管   刘丹

【课程时间】

2019年12月12日19点(本周四)

【课程链接】

点击链接:https://www.aidaxue.com/live?id=29&ch=cto,进入课程直播间

AI公开课 | 我猜你对数据标注还不了解吧?

AI 数据 人工智能
上一篇:自动优化架构,这个算法能帮工程师设计神经网络 下一篇:谭茗洲:技术创新者—少有人走的路│LeaTech全球CTO领导力峰会回顾
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

MIT提出Liquid机器学习系统,可像液体一样适应动态变化

麻省理工学院(MIT)的研究者开发出了一种新型的神经网络,其不仅能在训练阶段学习,而且还能持续不断地适应。

机器之心 ·  2021-02-21 15:47:47
规划智慧城市时,别忘了无障碍通行

要想成为一个智慧城市甚至一个智慧世界,虽然可能需要时间和有针对性的规划,但我们必须以人为本。

蒙光伟 ·  2021-02-21 10:26:41
2021关于人工智能的五大趋势

数字化变革,比过去10年更多,这主要是由于远程工作的规模,以及企业迅速部署了必要的技术,尤其是与网络安全相关的技术。那,2021关于人工智能的五大趋势会是如何的呢?

Lichu ·  2021-02-21 10:21:01
使数据中心更智能:人工智能如何发挥作用?

随着数据成为维持几乎所有业务运营以获取洞察力和业务成果的先决条件,数据中心正处于这种数字化转型的关键。

Cassie ·  2021-02-21 10:14:59
IBM拟出售Watson Health后,AI医疗还能不能碰

医疗服务仍然是一块商业上尚未被完全发掘的市场,看病难/看病贵、医疗资源紧缺、医疗资源不平均等痛点问题长期存在,对应的市场空间理应是巨大的。而Watson Health作为IBM曾寄予厚望的业务方向,为何要在此时萌生退意?它的故事给业界带来哪些启发?眼下的AI医疗市场,究竟是一副什么样的局面呢?

物联传媒 ·  2021-02-21 08:41:16
抛弃归一化,深度学习模型准确率却达到了前所未有的水平

我们知道,在传递给机器学习模型的数据中,我们需要对数据进行归一化(normalization)处理。

机器之心 ·  2021-02-20 21:09:12
华人博士生首次尝试用两个Transformer构建一个GAN

最近,CV 研究者对 transformer 产生了极大的兴趣并取得了不少突破。这表明,transformer 有可能成为计算机视觉任务(如分类、检测和分割)的强大通用模型。

Yifan Jiang ·  2021-02-20 21:04:53
无监督训练用堆叠自编码器是否落伍?ML博士对比了8个自编码器

柏林工业大学深度学习方向博士生 Tilman Krokotsch 在多项任务中对比了 8 种自编码器的性能。

Tilman Krokotsch ·  2021-02-20 20:57:16
Copyright©2005-2021 51CTO.COM 版权所有 未经许可 请勿转载