人工智能“小冰”创作的原创画作被当成了Bing的首页图

  继写作、唱歌后,微软人工智能“小冰”又实现了原创绘画的能力。

  5月16日,微软正式对外发布人工智能小冰的绘画模型。该模型通过对过往四百年艺术史上236位人类画家画作的学习,独立完成100%原创的绘画作品,接近专业人类画家水准。

  作为Bing中国及日本、微软小冰全球产品线负责人,微软(亚洲)互联网工程院副院长李笛及他的团队设计了一个巧妙地联动——用人工智能微软小冰的一副原创画作,当做了今天Bing中国的封面图。李笛表示,不同于简单的复制、调色、随机生成,微软小冰的绘画能力是基于文本或其他创作源激发,由人工智能100%原创的绘画作品。

  值得一提的是,今年微软小冰以“夏语冰”的化名通过了毕业考试成为了中央美术学院的硕士毕业生,并且在中央美术学院2019届研究生毕业作品展上首次展出。同时,小冰的首次个人作品展将于6月举行。

  与诗歌一样,“小冰”的绘画能力也会通过小程序运营推广给大众,“少女画家小冰”绘画创作小程序将在一周后(5月22日)上线。

  几年前阿尔法狗战胜了人类九段棋手李世石,“人工智能究竟有多像人类”、“人工智能会替代人类吗?”、“人工智能究竟能做到哪一步”等等争论就从未停歇。而让人工智能创作,似乎又是一个充满争议的方向。

  谈到为什么要让人工智能进行创作,李笛表示,目前世界上大多数人工智能的开发都是围绕着任务驱动型、知识型的路线来架构。但近些年,各大科技公司开始越发注重对人工智能EQ(情商)的开发,不仅仅是微软,亚马逊开始希望Alexa能够有同理心。百度也提出“智能体”这个概念,要求人工智能更加有个性,更加有人设。人工智能的构建已经从单纯的IQ开始向IQ+EQ演变。(详见钛媒体前文:

  第六代小冰上线了,微软为什么要花四年时间探索情感 AI?

  “我们希望人工智能创造的目的,不是取胜,而是面向高度定制化的时代的内容供需关系。提供更快、更稳定、高并发的创作能力。”

  会唱会写会画的小冰,离人类创作水平还有点远

  小冰目前会唱歌(语音)、会写作(文本),而今天新发布的模型则赋予了小冰绘画(视觉)的能力。

  以钛媒体现场来看,目前小冰的唱歌能力是最强的。现场也公开小冰演唱模型的第五个版本。除了能让小冰像人一样“换气延长”外,新模型还改善了歌声唱腔转换的自然度,并首次公布了戏腔训练成果。而李笛也透露,比起友商来说,小冰平均舒适时长、也就是听众能够接受的最大连续播放时长是最高的。小冰的ACD(有声读物·平均舒适时长能够达到21.5分钟,而友商基本在五分钟以下。

  而在文学创作上,小冰的诗集也在一定程度上引起了争议(详见钛媒体文章:人工智能写作的天花板在哪里?),而对于更加依赖主观的“绘画”,很难用画的“好不好”来评价这些作品,但毋庸置疑,人工智能做原创输出已经非常不容易了。微软亚洲互联网工程院为对该项目的研发已经整整持续了22个月。

  对于争议,微软(亚洲)互联网工程院人工智能创造及商业事业部总经理徐元春现场呼吁,不要带着“有色眼镜”去看人工智能创作。“人类一旦戴上这种有色眼镜之后,他所提供的反馈就都是错误的,有可能会把我们引向另外一个极端。”

  抛开大量技术细节,小冰绘画模型有两大特点:特点一:会大量使用诱发源,不是让机器把一种已有的视觉元素转成另外一种风格重新生成,而是要求在诱发源的帮助下,激发人工智能进行重新的创作,这是这个模型最显著的特点。特点二:机器在这个过程中会对人类社会最顶尖的艺术创作进行大量的学习。

  但在钛媒体来看,小冰的创作仍然距离人类创作还有点远。在命题创作上,乍一看,上述画作是颇具“艺术色彩”的,但如果仔细理解“中国的城市化进程”这个命题,小冰所画的内容基本上都在“建筑”、“人”、“家具”这几个模棱两可的元素上来回重复,有点类似“xx星座就是这样的”巴纳姆效应。

  小冰以“中国的城市化进程”为命题,仿照人类画家的风格进行的命题创作。

  与诗歌一样,“小冰”的绘画能力也会通过小程序运营推广给大众,将在一周后(5月22日)上线面向大众的绘画创作小程序。在小程序中输入创作词语,小冰就会开始沿着以下程序进行绘画原创,这比小冰写诗的过程要复杂得多。

  但现场开放的小程序版本并不能像上述DEMO中那样完全理解命题。当钛媒体编辑把“中国的城市化进程”这个命题输入到测试版的小冰绘画小程序里,小冰甚至回答“这些内容不好发挥,再换一个吧”。

  而即便是输入“城市”这个词语,可以看到,小程序中的小冰依旧会把城市跟椅子、时钟这类的元素联系到一起,画作也不算完整,甚至有些过于抽象。

  “小冰”们的商业价值体现:需要简单创作能力、重复性强而又人才稀缺的岗位

  不过,值得思考的一件事情是,类似小冰这种“情商”比较高的人工智能们的商业化价值在哪儿?李笛表示,在文本创作、语音创作和绘画创作上,小冰团队都已经寻找到明确的产业化落地场景。目前微软小冰在各内容生成领域的进展如下:

  文本创作,目前主要覆盖诗歌、金融摘要及研报等两个领域。郑州看×××哪家医院好:http://mobile.hnzzyyxb.com/

  语音创作,目前主要覆盖音乐、有声读物和电台电视台节目内容等三个领域。

  视觉创作,目前主要覆盖绘画及纺织服装面料设计等两个领域。

  一方面,情商高的人工智能被塑造成IP,以虚拟歌手、虚拟作家、虚拟画家的身份被运营。但如果说歌手、主持人、画家都无法带来“普通”的规模性收益,“小冰”们更多的商业价值是体现在需要简单创作能力、重复性强而又人才稀缺的岗位。