做过10亿次设计的人工智能「鹿班」,原来是他负责的!
这期节目我们请到了阿里巴巴智能设计实验室的负责人乐乘。这个智能设计实验室有个最著名的项目叫鲁班(现更名为鹿班),大家可以简单的把鹿班理解为一个人工智能设计师,去年这个名叫鹿班的智能设计师在双11期间为阿里绘制了4.1亿张各不相同的个性化广告图,而今年鹿班甚至开始学会设计网页了。人工智能会对设计这个行业造成怎样的影响,它会判断美丑吗?鹿班会像 AlphaGo 超越人类围棋手一样,在未来超越人类设计师的水平吗?所有这些问题,我们会在这期节目里和乐乘一一讨论。
△ 乐乘在阿里巴巴 UCAN 上介绍鹿班
一、双11的4.1亿个广告 banner,全都出自「他」之手
UX COFFEE:鹿班这个项目的由来是什么?
乐乘:阿里在2015年的双11第一次尝试了个性化推送,不同的用户在会场的界面中会看到不同的商品和内容。这次的转型非常成功,很大地提升了流量的分发效率。但那时的个性化推送还是很有限的,我们只能在搜索的结果,或者说推送的商品上做到个性化。2016年初,我们和算法团队就开始思考,能不能再往前迈一步,从设计的角度出发,让用户不仅看到的商品不同,而且看到的广告图也是千人千面的。我们觉得这会是一个非常大的突破,所以就起步做了这个项目。
UX COFFEE:在鹿班之前,商品广告推送的设计流程是什么样的?
乐乘:在鹿班之前,靠的都是人力。比如说,我们有十张广告的轮播,大家可以去申请,然后根据业务的重要程度排优先级,批复以后再找设计师画图,到了时间点上线图片,时间过了再下线,这一切都是靠人力完成的。有了鹿班之后,就算有十几万个商品参加申请广告轮播,鹿班也可以把所有商品进行抠图、自动生成广告,然后再投放,全部过程都是由系统来实现的。
UX COFFEE:你们是怎么在阿里这么大体量的公司里自下而上推动这个项目的?
乐乘:最早发起的时候,我们只是自己觉得这个想法挺靠谱的,就抽出时间尝试这个想法。我们最早是在手机淘宝的广告 banner 上做了尝试,把用机器生成的几万张图和人力生成的图片进行对比。我们发现机器生成的图片加上精准的个性化投放,能让同一位置的点击率翻一倍。有了这样直观的验证,我们就把鹿班接入了整个产品,鹿班的价值越来越高,团队也从早期三个人开始慢慢扩大。
有一个非常关键的节点,就是我们意识到如果设计的产能不能快速升级,鹿班是满足不了千人千面的海量图片需求的。所以我们当时对鹿班的定位做一次升级,我们要把鹿班从一个个性化广告的推荐系统,变成一个人工智能设计师。
UX COFFEE:你们对这个「人工智能设计师」有更详细的定义吗?
乐乘:准确地来说,现阶段我们想要做的是人工智能的平面视觉设计师。
UX COFFEE:2016年我在网上看到一个数据,之前你接受采访的时候说,阿里用鹿班设计了1.7亿个广告图。你们有没有计算过,这些广告图如果要人力来做,需要多少人力和时间?
乐乘:我们去年其实投放了4.1亿张广告图,我们大概算了一下,相当于是200个设计师不吃不喝做200年。但是话说回来,纯粹站在产能的角度去评判这件事情的意义并不大,因为机器本身擅长的就是批量生产,这并有没什么可炫耀的。我们也很少站在节省成本的角度去评价这个系统的价值。当机器做到了人做不到的事情,产生了过去产生不了的价值,打开了业务新的边界,这个才有意义。
△ 2017年,鹿班在双11期间投放4.1亿张广告图
二、人工智能是如何学习设计的?
UX COFFEE:鹿班具体是怎么运作的呢?你们生成千人千面的广告图片的机制是什么?
乐乘:鹿班的整体架构有三个核心单元。第一就是我们从过去海量的设计稿中利用深度学习提炼出设计经验。深度学习就是从很多高维的、海量的数据中提取隐含的特征。举例来说,一张广告设计图中,有一件碎花连衣裙、花朵和蓝天的背景。这张图片是含有很多维的信息,比如背景的纹理、字体的大小、色彩的搭配、还有设计元素之间的位置关系等等。通过深度学习,我们就能把这些高维的像素图片抽象为了一个蕴含这些多维信息的量化图。通俗来说,这张量化图就是这张设计图中蕴含的设计知识。当数据量足够大时,鹿班就能总结出一个通用的设计的知识模型。
当我们总结了许多设计知识后,面对一个设计需求,鹿班要怎么去根据量化图反向生成一张像素图片呢?这就要说到第二个核心单元——行动器。举例来说,通过学习那张碎花连衣裙的广告图,再遇到类似的需求时,鹿班就会在这张设计的基础上,从一个海量的设计素材库里索引,匹配和替换其中的元素,然后经过大量的计算跟迭代,最后生成一张新的图片。这其实就是强化学习的过程,就是在一个受限的空间和范围内去不断尝试,通过内部或外部会提供的反馈,得出一个最优的结果。
第三个核心单元就是评估。因为鹿班会得到非常多的结果,需要一个评判的机制来鉴定这些结果是否符合设计的要求和标准。这个部分的进展没有前两个单元那么快,因为这是一个非常宏大的命题。我们也在和很多高校合作,研究如何让机器来评判美、丑,设计的好、坏。我们现在离让机器懂得审美这么高级的阶段还很远。我们能够做到的是制定一些规则约束。比如当一个设计明显不合理时,就可以作为一个约束条件放进去。另一方面,我们会人工给过去的设计成品进行打分,来让鹿班学习给任意一张图片打分。这个模块现在还在早期的阶段,还有很长的路要走。
UX COFFEE: 评估这个模块很有意思。你们想让机器学会审美,但是听起来我们距离这一天还很遥远,因为目前大部分判断美、丑的工作还是有人工介入的。这和 Google AlphaGo 的机器学习就很不一样,因为下围棋有一个非常特定的条件,就是获胜。但是设计这件事情并没有获胜的概念,美丑的概念是相对的,甚至是非客观的。听起来鹿班这套系统并不会设计出人还没有设计出来的东西,就是不会超出人类设计师的水平,是这样吗?
乐乘:这个问题问得很好,我觉得不能用一个是或者不是来回答。我更想分享一下我对这个事情背后的想法。还是回到和 AlphaGo 的对比来看,正是因为围棋是一个规则评判标准非常清晰的游戏,它的量化的评估方式非常确定,所以 AlphaGo Zero 才能够脱离人的输入自己学习,甚至通过学习发现人下围棋的方式可能都错了。AlphaGo Zero 的成功是这个场景的特性决定的。但是人类社会里面有多少问题,能像围棋规则这么确定呢?其实大部分都不是。设计就是非常典型的,有着无穷无尽的计算空间,历史的进化的过程中有不同的趋势。它是个人文问题,也是个社会问题,而不是一个纯粹的数学问题。当我们做到比较深的一个阶段之后,这个命题背后的复杂度和对算法技术的挑战,远比我们早期想的要复杂得多。
现阶段鹿班确实不能生成超出人类能力太远的设计来。未来的几年我们还会继续深入这个命题。未来有一天,机器有可能真的会做出我们都没有见过的设计。
△ 人工智能学习设计 (图片来源:微信公众号「阿里巴巴UED」)
三、让商家有自己的小鹿班
UX COFFEE:在淘宝上卖货的很多品牌商家,他们对于自己的品牌形象、设计风格,应该也是有要求的,鹿班要如何去满足他们的要求呢?
乐乘:对于这个问题,我们的解决方案就是向品牌商家开放我们的训练体系。阿里作为平台方,我们只能知道这个品牌过去做过什么设计,却没法知道他们对未来的需求,所以我们决定开放鹿班这个平台,让企业主也都能使用自己的小鹿班来做设计。
UX COFFEE:那鹿班生成的这个设计的结果如何?会不会有设计程式化的、模板化的问题?
乐乘:其实这个模型里的多样性和确定性的参数问题。多样性高了,机器就会产生很多新的变化,但有可能结果就会过度发散。但如果把确定性做到极致,在算法里面就有一个过拟的问题,机器学出来东西跟原来一模一样,这就失去了学习的意义。所以我们尽量要在多样性和确定性之间有一个平衡。
UX COFFEE:你们下一步的计划和目标是什么?
乐乘:除了刚刚提到的向商家开放平台,另一方面就是内容设计。因为广告图还只是一个单张图片的设计,但平面设计师还有很大一部分的工作是在做网页、易拉宝、宣传单,这种内容复杂度高于广告图的设计。这类的设计在技术原理上其实是相通的,只是我们会更侧重对复杂内容的表达。这样鹿班能够覆盖的平面设计的工作就更广了。
UX COFFEE:那国内的路边摊广告公司可能要感受到很大的威胁。因为我以前在大学的时候就会去做很多讲座的海报、易拉宝,确实都是很模板化的,我可以想见鹿班的这套人工智能系统会更快,甚至更好地完成这些工作。我也知道阿里是一家非常重运营的公司,你们几乎每天都有运营活动,如果运营活动的页面能够全都使用人工智能来做设计的话,对公司运营的规模化也能起到很大的帮助。
△ 阿里推出了驯鹿计划,让商家可以训练自己的鹿班
四、设计师们真的会失业吗?
UX COFFEE:如果人工智能可以做设计师的工作,那设计师以后的饭碗会不会受到威胁。你会不会思考做这件事情是不是搬石头砸自己的脚?
乐乘:这个问题很有意思。我觉得不同角色会有不同的视角看待这个产品。我作为这个项目的牵头人,我想的是如果这事能够做成,它会对设计行业有巨大的颠覆。就算有一天我真的被这个智能设计师淘汰,我也是很开心的。因为这件事即使我们不做,未来也一定会有人做。历史潮流或技术趋势对专业领域(的改变),是不以任何人的意志而改变的。
而我的设计同事,他们的态度比较中立。他们觉得「鹿班想淘汰我还早得很」,鹿班还不具备设计复杂系统的能力。所以他们对鹿班是一个开放的态度。他们会觉得「如果鹿班能帮我做一些我不想做的事,也不错」。
但和我们合作的外包供应商的设计师是有些心慌的。因为他们本来的工作是很容易被取代的。他们会开始想办法转型跟升级。
UX COFFEE: 人类和机器这对关系,可能是未来100年我们都会一直讨论的问题。对于鹿班来讲,这个命题更小一些,它是人类设计师和机器设计师之间的这样一个关系。你觉得人工智能设计未来会变成什么样?
乐乘:之前我听过一个很有意思的比喻——如果说真正的人工智能相当于人类登月,那现在的人工智能就只是人类爬到了树上。所以这真的是一个很宏大的命题。我们现在也只是走出了一小步。现阶段主流的算法技术是数据驱动的智能——有多少数据就有多少智能,没有数据就没有智能。但真正的设计智能,我觉得他应该不是纯粹数据驱动的。像刚刚提到的审美,光靠数据可能真的搞不定。当然未来也许像神经网络这类学科会有突破性的发展,等我们真的搞清楚了人类是怎么理解、认知问题的,到那个时候可能机器才能到「登月」的阶段吧。阿里现在也在和顶尖的研究所合作,做一些像美学评估这类面向未来的研究。
△ 乐乘在2017年 UCAN上关于人工智能的演讲
五、人工智能离能够「思考」还有多远?
UX COFFEE: 在你看来,机器具备设计智能的下一个节点会是什么?
乐乘:如果站在数据智能的这个边界内去思考的话,我觉得当数据规模到达一个临界点之后会有一次跨越。直白的说,就是当今天人类做过的设计,机器都做过,人类看过的东西,机器都看过的时候,我觉得他可能就真的成为了一个大而全的数据智能机器。另一个可能的突破就是脑神经领域。如果真的能把脑神经的知识与人工智能结合,可能会带来一次比深度学习更大的革命。
UX COFFEE:你认为人类设计师和机器设计师相比,彼此的优势和劣势是什么?
乐乘:我觉得人类设计师在灵感、创造、人文、社会问题的理解是机器哪怕到了未来阶段也不一定能做到的。现在机器的一个很明确的短板是它的认知能力是有限的,它不是真正地懂得内容。比如各国的文化禁忌,你觉得机器能理解吗?我觉得很难。
UX COFFEE:为什么会很难?
乐乘:比如说,在欧洲某个国家黑色的猫是不吉利的,所以天猫进入那个国家的时候,不能用黑猫的形象。今天你可以用一个指令告诉人工智能你不能做什么,但是它并不是智能,像这类的文化禁忌,今天机器是不会理解这背后的文化内涵的。
UX COFFEE:它需要去理解吗?我觉得 AlphaGo 给我的一个很大的冲击就是我觉得它其实并没有像人类那样去理解围棋这件事情,我们对围棋总结出了很多的规则,甚至上升到了哲学高度。但机器没有,它就是自我博弈,就习得了围棋的技巧。在它眼里,没有那些哲学概念,但它依然可以下到最好。
乐乘:对,人工智能把围棋当作一个数学问题在解,而人类把围棋当成了一种文化或者是艺术。但我也听到过一个反面观点,就是正因为今天人类没法去解这个宏大的数学问题,所以才用文化来解释它,其实也是因为人拿它没办法。也许我们下了那么多年的围棋,可我们并没有下对。
UX COFFEE:会不会有一天我们发现我们做了这么多年的 UI 都没做对,我们对界面的理解还是太浅薄。
乐乘:对,也就说有可能机器会做出比人更懂人的一些设计出来,或者让人更喜欢的设计出来,我觉得这个脑洞真的有可能。
UX COFFEE:作为人工智能设计师的设计者,你会给现在设计师什么样的建议?
乐乘:因为鹿班是从大规模的数据里抽象出的一种设计能力跟设计执行的产品,这就决定了它的上限——它的最好水平和人类的最好水平是有差距的。但是机器的下限或它最差水平却要比人类的设计要好很多。所以我判断人工智能设计会在中上游的水平,它到达不了顶尖,但是它会比很多刚入行的设计师要做的好。这可能是从设计院校刚毕业的同学必须要面临的问题,对于他们来说,刚走出社会的第一启动阶段的压力会比前辈们要高很多,你将不能在低阶上停留太久,自己的设计执行力要赶紧补上。对于高阶的设计师,我倒觉得不用担心,因为如果你知道它的原理,你就会知道哪些东西是可以给机器干的,哪些东西要自己专注去干,我觉得未来高级设计师永远是稀缺的。
参考链接
- 鹿班官网:https://luban.aliyun.com
- Alpha Go: https://deepmind.com/research/alphago/
扫描二维码或微信内搜索「UXCoffee」,关注 UX Coffee 设计咖 微信公众账号:
「人工智能时代,设计师如何应对」
- 《实战案例!阿里巴巴如何用人工智能做Banner 设计?》
- 《人工智能时代来临,设计师会被淘汰吗?》
- 《设计师如何在智能化时代持续学习和成长?来看高手的方法!》