写给设计师的人工智能科普指南:基础概念篇
当谷歌打造的阿尔法狗击败了围棋特级大师,当辛辛那提大学的Psibernetix击败了战斗机飞行员,当互联网时代到智能时代,当时代开始迁移,没与时代并行的,最后只能被时代淘汰。那么对于设计领域而言,和人工智能有哪些结合点?身为设计、交互、产品的我们如何了解人工智能?欢迎关注本系列,我们一起探索设计与人工智能!
互联网从业者近几年最熟悉的词汇莫过于智能、算法、AI。随着海量数据存储及计算能力的发展,人工智能AI已成为一种底层能力,在结构化数据计算、自然语言处理、计算机视觉等领域广泛应用。本系列将围绕人工智能AI基础能力与设计领域智能化展开,如果你是设计师或产品经理,你可以了解到入门AI的基础知识、人工智能是如何影响设计与交互,把握智能设计的「可」与「不可」;如果你是算法或技术同学,本系列不会涉及前沿算法的分享,但你也可以了解到在设计专业领域我们对于智能化的一些思考。
人工智能AI作为底层能力,其目的不是为了替代传统设计师的工作,而是通过计算机的算力(计算能力)与规则,提高强化设计能力与效率,通过让机器学会设计把机器变成设计师的助手。
设计智能的突破,其实得益于AI算法框架(深度学习模型)的提出和普及,近些年的设计智能主要应用在设计语义提取、风格识别、风格迁移、设计评价推荐、设计对抗生成等。
举个栗子,小米CC9手机在发布时便推出了一个叫「魔法换天」的功能,用户拍摄一张带有天空背景的照片,可以变换成晴天、阴天、夜晚等各种不同风格的天空。
对于「换天」,从交互设计上的呈现模型看,只是用户端「设计风格」的一键切换;但如果我们从实现模型来看,首先需要实现图片语义切割,让机器学会分辨什么是天空;接着,通过海量不同风格图片数据的输入让机器学会什么是风格,这中间就会应用到不同的算法模型,比如#卷积神经网络CNN#结合#注意力机制Attention Networks#进行关键特征抽取实现风格分类;最后,可以再通过#对抗生成网络GAN#的生成模型和判别模型训练输出最优的目标风格图片,完成用户的「魔法换天」操作。
经典的设计智能例子还有很多,作为交互设计,上述的算法模型框架和实现细节可能不是我们的重点,我们需要关注的其实是AI算法的能力与边界,从而思考AI如何影响产品交互与用户行为。要想掌握算法的能力与边界,那接下来的基础入门概念你一定不能错过。
1. 「算法是什么?算法怎么用?」
通俗来讲,算法其实就是数学公式,是有限且确定的一套解决方案或解题步骤,对算法来说输入A和输出B必须是固定的,算法只负责中间的输出逻辑。比如说,为了计算加减乘除,老师总结出了乘法口诀;再比如,为了让用户更快地收到商品,配送系统研发了路径规划优化算法。
在场景应用上,算法必定是基于某个业务场景痛点,为了解决某一类业务问题抽象,脱离了业务场景算法便失去了意义。在解决业务问题的同时,需要保证方案的准确以及完整,这也是算法同学通常在交付算法模型时会使用的两大评测指标:准确率与召回率(查全率)。简单来说,准确率衡量的是算法模型去预测某个对象或事件时多大比例是预测准确;而召回率评判的是算法模型在待预测对象或事件堆中能预测出的比例。准确优先就是更准,召回优先就更全,任何算法没办法同时做到既准确又完整,只能是基于业务场景和优先级两利相权取其重,但在大多数的电商推荐场景下更加关注准确性。
2. 「算法还分监不监督?」
刚刚提到算法是约定好输入输出下的一套解决方案,那么在逻辑黑盒的训练和学习方式上,会分为有监督学习和非监督学习。
有监督学习,就是我们提前和机器约定好什么是A什么是B,机器按照我们的标准进行训练学习;有监督学习要求算法模型的输入必须经过人工预先处理,也就是数据打标。经典的有监督学习方法,包括回归以及分类,基础数学中的回归方程其实就是一种有监督学习。
无监督学习,顾名思义,我们无须定义好标准和规则,算法会通过特征抽取自动进行训练学习。无监督学习一般会通过聚类算法来实现。
3. 小结
算法是约定好输入输出的解题步骤,要让机器学会判断,可以手把手教它(有监督),或者是放养式让它自学成才(无监督)。
如果说算法是解题方案的话,机器学习与深度学习更像是不同阶段的解题思路与解题结构。
1. 「什么是机器学习?」
机器学习,通俗的讲,就是不断通过尝试及反馈最终让机器出色地完成某一项任务。假如现在机器要参加高考并且目标是拿第一名,按机器学习的思路,机器会把历史考题都答一遍,学习考题和答案的联系,再不断地反复答题提高准确率,最后参加考试获得第一名。
在上面这个栗子中,其实涉及到了几个关键要素:任务T、性能度量P、经验E。任务T是机器学习或算法的最终目标,也就是获得考试第一名。性能度量P则是我们优化数据结构或算法逻辑的Benchmark,定义合适的性能度量指标对于机器学习的效率及提升都至关重要。最后的经验E,其实指的是历史数据或效果数据,也就是历史的考题以及答错的考题。
在电商领域里,经典的人货匹配推荐算法就可以按上面的定义描述为,是为了更准确地向不同用户推荐个性化商品(T),通过历史推荐数据及用户行为数据(E),不断提升推荐结果准确率(P)的解题过程。
小结:机器学习基于历史数据,通过模型学习训练输出预测数据,再基于反馈数据不断优化提升预测模型。
2. 「深度学习与机器学习有什么区别呢?」
再回到我们的例子上,高考不仅会有客观题,还会有主观题,假如这次我们机器来给作文评分,传统的机器学习很难按照人类的思维方式和行文逻辑去分析。深度学习的出现,使得机器能够「像人一样思考」,通过仿生神经网络的建立,机器能学会和理解复杂事物间的联系,并通过感知外界优化自身网络结构。
也就是说,深度学习模型,其实也是机器学习的一种,只不过学习方式变成了,通过构建类人脑神经网络结构的多层感知结构,以及低维特征的组合及向量化,来挖掘样本数据特征,从而建立数据与结果的关联关系。
要想更好的理解深度学习与神经网络,我们首先得了解人脑是如何感知与理解信息(数据)的。中间的网络图是抽象化的人脑结构表示。
每个圆圈代表一个神经元,每个箭头代表一组神经突触,信息从左侧输入层进入,中间经过若干个隐藏层以及不同权重的神经突触传播,从右侧输出层输出;不同权重的神经突触会过滤或是加强不同优先级的信息,从而指导人的行动。
基于人脑神经网络结构,深度学习模型首先通过Embedding向量化将高维稀疏特征转换为低维稠密特征,接着通过隐藏层来保留重要特征,再通过输出层的损失函数Loss判断训练误差是否符合输出要求,最后完成模型输出。
深度学习相较于机器学习,最大的突破在于数据特征挖掘即特征向量化的过程,因此深度学习框架一般会用于复杂的非结构化数据场景,如语音识别ASR、文本处理NLP、图像识别CV等便是典型的应用场景。
小结:机器学习是实现人工智能的一种方法,深度学习是进行机器学习的一种技术。
算法也好,机器学习也好,其实都是解决问题的方法。算法解题效果好坏很大程度上取决于前期的业务问题抽象和转化。
因此对于产品或交互同学,关键是在了解算法技术能力边界基础上,基于对业务场景和需求的梳理,将业务问题转化为算法问题,找到最合适最高效的算法框架实现业务目标。同时在产品交互设计过程中,尽可能降低人机交互的教育成本,使得表现模型贴近用户心理模型。
算法是规定好输入输出的一套解题步骤,会有机器学习以及深度学习两种不同的算法框架。对于不同算法模型,产品交互同学更多关注的是,算法可以解决什么问题以及如何以更人性化的交互逻辑实现产品智能化,降低算法应用成本。
京东人工智能设计神器「羚珑」是如何创造出来的?
肥皂(SOAP)是由京东零售体验设计出品的短视频栏目,每期邀请行业内外具有一定影响力的人物进行采访,选择大家感兴趣的主题,挖掘更多能人趣事。
阅读文章 >
欢迎关注「JellyDesign」的小程序: