MIT新研究表明机器学习不能标记假新闻

作者: 佚名 2019-10-16 11:52:15

麻省理工学院研究人员发表的两篇新论文显示,当前的机器学习模型还不能完成区分虚假新闻报道的任务。在不同的研究人员表明计算机可以令人信服地生成虚构新闻故事而无需太多人为监督之后,一些专家希望可以训练基于相同机器学习的系统来检测此类新闻。但是麻省理工学院的博士生Tal Schuster的研究表明,尽管机器学习模型擅长检测机器生成的文本,但它们无法识别故事是真实还是虚假的。

许多自动的事实检查系统都使用称为事实提取和验证(FEVER)的真实陈述数据库进行培训。

在一项研究中,Schuster和他的团队表明,即使他们知道肯定的陈述是正确的(“Greg说他的汽车是蓝色的”),机器学习事实检查系统也难以处理否定的陈述(“Greg从未说过他的车不是蓝色的”)

研究人员表示,问题在于数据库充满了人为的偏见。创建FEVER的人倾向于将其错误条目写为否定陈述,而将其真实陈述写为肯定陈述-因此计算机学会了将带有否定陈述的句子评为虚假。

这意味着系统正在解决一个比检测虚假新闻更容易的问题。麻省理工学院教授Regina Barzilay表示:“如果为自己创造一个简单的目标,就可以实现该目标。但是,它仍然无法使您将虚假新闻与真实新闻区分开。”

两项研究均由Schuster带领,并由MIT合作者团队完成。

最重要的是:第二项研究表明,机器学习系统可以很好地检测机器编写的故事,但不能将真实的故事与虚假的故事区分开。

MIT 机器学习
上一篇:人工智能进入大学校园带来了哪些变化 下一篇:4 分钟!OpenAI 的机器手学会单手解魔方了,完全自学无需编程
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

选择正确的人工智能用例的5个技巧

很多企业可能对采用人工智能还没有做好准备,因此从单个项目开始可能是一个很好的开始。首席信息官在早期人工智能项目中应该有什么收获?

David Petersson ·  12h前
一份不可多得的数据科学与机器学习Python库

本文全面地介绍了当前市场上适合于数据科学和机器学习的优秀 Python 库。

陈峻 ·  19h前
深度神经网络可解释性方法汇总,附Tensorflow代码实现 精选

理解神经网络:人们一直觉得深度学习可解释性较弱。然而,理解神经网络的研究一直也没有停止过,本文就来介绍几种神经网络的可解释性方法,并配有能够在Jupyter下运行的代码连接。

代码医生 ·  3天前
数据转换率较低将如何严重影响机器学习

如今,机器学习以多种有益的方式改变着市场的未来发展。数字营销研究机构的调查报告表明,97%的决策者认为机器学习技术将促进未来市场发展。

Sean Mallon ·  4天前
解读机器学习翻译的局限性

机器学习翻译对于人们的交流非常有益,但是它们也有其局限性。机器学习为企业提供了翻译文档的新机会,他们可以使用机器学习来翻译营销材料和其他文献。但是,这些人工智能解决方案可能并不总是很好的选择。

Ryan Kh ·  2019-11-06 11:34:53
优秀的机器学习情绪分析工具(创业公司)TOP5

最佳的情感分析公司和机器学习工具有哪些?以下我们整理了数家目前市场上较为优秀的,基于机器学习的情感分析工具/创业公司。

CashCat ·  2019-11-05 10:26:49
大数据架构详解:从数据获取到深度学习 精选

机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。其专门研究计算机是怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。此外,数据挖掘和机器学习有很大的交集。

阿福班主任 ·  2019-11-04 14:28:55
跨专业自学NLP,这个90后撸出了开源类库HanLP,已在GitHub收获1.5W星 精选

截止 2019 年 10 月底,一款名为 HanLP 的自然语言处理类库在 GitHub Star 数达到了 15.5 K,超过了宾夕法尼亚大学的 NLTK、斯坦福大学的 CoreNLP、哈尔滨工业大学的 LTP。

刘燕 ·  2019-11-04 13:51:13
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载