MIT新研究表明机器学习不能标记假新闻

作者: 佚名 2019-10-16 11:52:15

麻省理工学院研究人员发表的两篇新论文显示,当前的机器学习模型还不能完成区分虚假新闻报道的任务。在不同的研究人员表明计算机可以令人信服地生成虚构新闻故事而无需太多人为监督之后,一些专家希望可以训练基于相同机器学习的系统来检测此类新闻。但是麻省理工学院的博士生Tal Schuster的研究表明,尽管机器学习模型擅长检测机器生成的文本,但它们无法识别故事是真实还是虚假的。

许多自动的事实检查系统都使用称为事实提取和验证(FEVER)的真实陈述数据库进行培训。

在一项研究中,Schuster和他的团队表明,即使他们知道肯定的陈述是正确的(“Greg说他的汽车是蓝色的”),机器学习事实检查系统也难以处理否定的陈述(“Greg从未说过他的车不是蓝色的”)

研究人员表示,问题在于数据库充满了人为的偏见。创建FEVER的人倾向于将其错误条目写为否定陈述,而将其真实陈述写为肯定陈述-因此计算机学会了将带有否定陈述的句子评为虚假。

这意味着系统正在解决一个比检测虚假新闻更容易的问题。麻省理工学院教授Regina Barzilay表示:“如果为自己创造一个简单的目标,就可以实现该目标。但是,它仍然无法使您将虚假新闻与真实新闻区分开。”

两项研究均由Schuster带领,并由MIT合作者团队完成。

最重要的是:第二项研究表明,机器学习系统可以很好地检测机器编写的故事,但不能将真实的故事与虚假的故事区分开。

MIT 机器学习
上一篇:人工智能进入大学校园带来了哪些变化 下一篇:4 分钟!OpenAI 的机器手学会单手解魔方了,完全自学无需编程
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

用机器学习备忘单解决艰巨问题,你行吗?

在本文中,我们将介绍如何使用备忘单简化机器学习方法,你可以使用该备忘单选择适合解决问题的正确算法。

读芯术 ·  1天前
“阿凡达”式脑-脑接口性能提升 2-3 个数量级

脑-脑接口这一概念,看过科幻电影《阿凡达》的人可能有点印象。在电影中,地球上的人可以通过脑对脑的直接信息传递,远程控制潘多拉星上经基因改造的蓝色类人生物 Na'vi 族。

付静 ·  3天前
探究谷歌用于构建量子机器学习模型的新框架:TensorFlow Quantum

TensorFlow Quantum让数据科学家可以构建在量子架构上运行的机器学习模型。TensorFlow Quantum的核心概念是将量子算法和机器学习程序交织在TensorFlow编程模型中。谷歌称这种方法为量子机器学习,能够利用其最近的一些量子计算框架(比如谷歌Cirq)来实现它。

布加迪 ·  3天前
算法之外:人工智能和机器学习对组织的影响

如今,数字科学对于企业来说,显得愈发地“诱人”。但是若要正确地看待数字科学,我们亟需了解下面一个问题:数字科学到底能为我们的业务发展做什么,不能为我们的业务发展做什么。

IMD商学院 ·  2020-03-24 15:15:54
韩松、朱俊彦等人提出GAN压缩法:算力消耗不到1/9,现已开源

近日,来自麻省理工学院(MIT)、Adobe、上海交通大学的研究者提出了一种用于压缩条件 GAN 的通用方法。这一新技术在保持视觉保真度的同时,将 pix2pix,CycleGAN 和 GauGAN 等广泛使用的条件 GAN 模型的计算量减少到 1/9~1/21。

Muyang Li等 ·  2020-03-23 15:10:49
五大方面:机器学习如何在不久的将来改变教育

如果你目前在学校或者在教育领域工作,那么对即将到来的变化有所了解是非常必要的。在这篇文章中,我们将探讨机器学习在未来几年改善教育的五种途径。

读芯术 ·  2020-03-23 07:18:22
互联网上20大免费数据科学、机器学习和人工智能慕课

现在是2020年,数据科学比以往更加民主化。这意味着任何个人只要有适当的工具和大量的数据,就可以在几乎没有专业知识的情况下进行数据科学研究。随着数据渗透到整个行业的每一个角落,拥有数据科学家的技能是大势所趋,也因此产生了一支会说数据语言的员工队伍。

读芯术 ·  2020-03-22 16:11:48
人工智能机器学习常用算法总结及各个常用算法精确率对比

本文讲解了机器学习常用算法总结和各个常用分类算法精确率对比。收集了现在比较热门的TensorFlow、Sklearn,借鉴了Github和一些国内外的文章。

程序员陈平安 ·  2020-03-20 11:22:09
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载