了解情绪划分:如何使用机器学习来保持积极心态?

作者: 读芯术 2020-10-25 08:59:00

本文转载自公众号“读芯术”(ID:AI_Discovery)。

“思考再思考,然后采取行动”,这样的流程是不是听起来很熟悉?大多数人都是这样做的。

然而,这个思考流程很可能是一把双刃剑:在一些情形下,结果可能积极有用,但在另一些情形下,结果可能有害,甚至反噬自身。后者是我们都希望避免的。为了清晰了解情绪的划分,我编写了这个机器学习(ML)程序。

隔离阶段让我有机会探索自我并审视自己的思路。我不是一个沉思者,但是总会陷入纷乱的思绪之中,每当这时,我都需要理清思路。因此我要创建一个可以分析我的思考过程的ML模型。我用KNN算法判断应该避免的情绪,并通过可视化技术将我的情绪以图形展示,使我清晰地一览全貌。下面是我的做法:

  • 作为开始,我创建了一个有不同想法的数据集;
  • 使用KNN算法;
  • 使用可视化技术;
  • 最后,我学会了分割思考过程。

创建数据集

数据集由九种情绪(特征)组成:沮丧,悲伤,卑微,哭泣,痛苦,困惑,快乐,振奋和坚定。我将它们分为三类(标签):积极,消极和中立。另外,我根据标签对这九种情绪/特征均按1-10的标准进行了评分。于是我创建了共150个案例。这是数据集的前几行:

使用KNN算法

在开始下一步之前,首先需要掌握一些监督式学习的ML基本术语:

  • 为了训练、测试和评估一个模型,我们使用一系列案例;
  • 这些案例包括与模型相关的特征和标签值;
  • 特征是用于训练算法的基础值;
  • 一旦训练部分结束,算法就能预测测试特征的正确标签值。

目标是正确预测标签。因此,受训算法的精度应该很高。如果不高,应使预测的标签值和原本标签之间的误差最小化。有了这些基础知识,让我们接着来了解KNN算法。KNN是监督式的机器学习算法,“K”是待分类点邻近值的个数 (例如,K=1、2、3等)。

左图中,KNN会将“?”归类为绿色星星,因为它最近。同样,在右例中KNN会将“?”归为黄色三角,因为这些三角形是最接近的多数情况。

新案例与已知案例之间的接近程度,可以使用任意距离函数,如欧几里得尺度和明可夫斯基尺度等体现。因此称之为最邻近。这样,KNN算法对新案例进行了分类。在这种特定模式中,KNN要正确预测各个情绪的分类。预处理所有数据后,我使用了KNN算法,然后计算出准确度为98.6%。这是显示相同的代码段:

使用可视化技术

我用数据可视化进行了分类,图表更便于理解,并创建了一种解决方案,用来预测我应该避免什么样的情绪才能保持一个积极的心态。这个技术将帮助我分辨标签类别(积极、消极和中性),为此我使用了“箱形图”。

结果

KNN生成的图表显示:

  • 沮丧:算法将该特征归类为消极,这是显而易见的。但值得注意的是,在消极和中立之间有小部分的重叠。同时消极与中性界限也非常细微。这表明沮丧的情绪在某种程度上能够激励自己取得积极成果。综合考虑后,它被归类为消极标签。
  • 困惑:这项结果很有意思,算法将其标记为积极。在分析之前,我曾避免自己有困惑情绪。也许这些摇摆不定的情绪也能产生积极的结果,也许它们给了我们时间来衡量形势的正反面。
  • 悲伤:毫无疑问,这类情绪注定会产生消极的结果。
  • 自卑:有时候头脑中会出现一些随机的想法。它们没有来由没有依据。算法将这些情绪归类为中性。
  • 哭泣:与悲伤特征类似,该特征也被归为消极。但我认为它可能也有中立的一面,因为哭泣可以帮助平衡情绪。但如果依据图表来给定标签,很可能将其归类为积极而非中性。总体来看,它会引发消极情绪。
  • 痛苦:根据模型的预测,痛苦是导致心情不好的最重要特征。因此,它是极其消极的。
  • 振奋:KNN预测这个特征对我有益。但是,该图显示中性和消极情绪略有重叠。此外,令人吃惊的是,如果我们仅考虑这两个标签,消极标签的影响要比中性标签大得多。
  • 坚定:该特征非常有趣。结果之间几乎没有任何区别,很难立即做出诠释,但是使用箱形图可以轻易地理解这一点。

箱形图提供了详尽的图示。图示清晰易懂,它们根据特征或思想给出了三种不同情绪或标签的清晰区分。它描绘的结果与KNN图或多或少相同,但它提供了更好的解释:

  • 坚定:尽管看起来这一特征明显会被归类为积极,但是KNN图表根据数据显示了这三个标签之间的相似性,这种相似性可能会产生误导。看看箱型图你就会发现,积极的结果只比另外两个高一点。因此,该特征被归类为积极标签。

快乐:毋庸置疑,此特征为积极标签。但是,它对中性的四分位数远大于正数,如果仅考虑中性和负数,则中性要高于两者。

图源:unsplash

这个项目非常有趣。起初,我以为分类结果是简单且显而易见的,但完成后,我才意识到这不仅仅是个分类。一个ML程序不仅能预测人类可以轻松完成的特定任务,还可以对数据集深入分析。

虽然这只是仿人智能的开始,但却非常有趣,也许这就是‘机器学习’命名的由来。

机器学习 情绪 ML
上一篇:“AI”的局限性:人工智能改变未来,还有一个尚未突破的问题 下一篇:张亚勤:对于产业来讲,深度学习的黄金时代刚刚开始
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

第四范式NeurIPS 2020:知识图谱嵌入的自动化

前不久,来自第四范式的资深研究员姚权铭博士和大家分享了其参与并被 NeurIPS 2020 接收的论文《Interstellar: Searching Recurrent Architecture for Knowledge Graph Embedding》。

机器之心 ·  1天前
AI的偏见:机器就是绝对理性的么?

人工智能已经遍布我们的日常生活。从YouTube的首页推荐到生产药物,它无所不在,它对我们生活的影响超出我们的想象。但人工智能一定公平吗?不,绝对不是。

读芯术 ·  3天前
机器学习平台在Kubernetes上的实践

本文回顾总结近一段时间网易云音乐机器学习平台(GoblinLab)在容器化实践的一些尝试。截止今日,音乐机器学习平台(GoblinLab)在容器化方面的尝试,已开展了一段时间,并且已经有了阶段性的成果。

王军正 ·  4天前
盘点:2020年最酷的12家机器学习初创公司

我们筛选了12家初创公司,有的已经成立了几年时间,有的刚刚起步,但他们都在致力于解决与机器学习相关的各种挑战。

CRN ·  4天前
微分方程VS机器学习,实例讲解二者异同

微分方程与机器学习作为 AI 领域建模的两种方法,各自有什么优势?

佚名 ·  2020-11-25 14:40:48
用新的机器学习思考方式 来辨别自然异常与人为误导

某些对抗性事件很可能是人为设计而来。我们必须知晓其中的手法与工件是什么,这样才能真正理解深度神经网络的可靠性。

佚名 ·  2020-11-24 19:31:41
面向未来系统设计的机器学习

Elias Fallon是行业领先的电子设计自动化技术提供商Cadence Design Systems公司的工程主管。他带领其定制IC研发团队以及电子设计自动化(EDA)产品团队进行项目开发。

Elias Fallon ·  2020-11-24 10:21:14
2021年码农应该了解的所有机器学习算法

随着我对机器学习的了解的增加,机器学习算法的数量也在增加! 本文将介绍数据科学界常用的机器学习算法。

闻数起舞 ·  2020-11-23 09:26:22
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载