什么是深度学习?

想理解深度学习(Deep Learning, DL),最简单的解释,可以将深度学习视为机器学习,若更进一步的定义,深度学习就是机器学习的进化版,是数据科学中的组成关键。
先来浅谈机器学习的定义。机器学习是 AI 人工智能的一种应用方法,通过大量的特征数据来训练 AI 模型,借由学习的过程,不断缩小真值与预测结果的差异,让 AI 模型最终能自行判断出正确结果。
图1. 深度学习包含在机器学习中
而深度学习,简单来说就是包含在机器学习中,它与机器学习的差异在于,机器学习使用算法来剖析数据,而深度学习是以“层次性”为算法的基础概念,通过模拟人脑的运作方式,创建人工神经网络(Neural Network),形成数学函数的集合,只要将输入的值丢入其中,经过大量的训练过程,进行复杂运算,有效处理非结构化数据,最终机器可得出比拟人类的行为判断。

深度学习是如何运作的?

图2. 鸟图
或许你会好奇,人工神经网络的深度学习,又该如何运作的呢?

让我们以幼儿学习为例。当家长要让幼儿学习辨识鸟类图像,以及发出鸟的发音,首先,家长会指着图片中的鸟发出正确的音,随后幼儿可能会陆续发出相似的发音,经过修正直到他们能理解这个字为止。而这种学习的过程,与人工神经网络有异曲同工之妙。
其實人工神其实人工神经网络是一种多层级结构,由输入层(input layer)、隐藏层(hidden layer)、输出层(output layer)所构建而成,每一层都蕴含不同权重(weight)跟变量(parameter),以多节点分析图片上的特征,最低层计算像素的黑白对比,第二层则依据第一层数据分辨边线等线条,通过层层非线性函数运算,最后将由输出层产出终值,也就是图片的分类与辨识。
图3. 人工神经网络
由于这类的神经网络需要多层神经元进行资料处理,通过一层一层的对比才能运行,运算复杂性相对高,而这也是为什么,深度学习被赋予「深度」概念的原因。

为什么深度学习很重要?

其实与 AR 一样,深度学习并不是全新的科技概念。早在1980年代,深度学习就以不同概念被提出,但当时电脑运算能力不足,验证成效不彰,直到近年来高性能处理器的出现及硬件的进步,才大幅提升数值运算速率,慢慢让外界将焦点转移到深度学习上,至今相关研究及应用仍不断推陈出新。
开发人员及数据科学家会利用深度学习程序,进行语音、图像、文字等辨识,进而分析复杂且庞大的数据资料,间接推动许多日常 AI 应用,像是 iPhone 内建的 Siri 虚拟助手,就是仰赖深度学习技术而生的真实案例。

深度学习有哪些用途?

深度学习是近期热门的 AI 技术,包含语音识别、自然语言处理、图像识别等,举凡各种和生活相关领域,都是其常见应用。

语音识别

语音识别(Speech Recognition)这项技术,最主要的目的是希望电脑能理解人类所说的话,让电脑自动将语音内容转成文字,并依据语音信号执行任务。现行较常见的语音识别应用,包含语音文件检索、听写资料录入、语音导航、室内装置控制等。

自然语言处理

自然语言处理(Natural Language Processing, NLP)是 AI 的分支,是可协助电脑理解、解释及操控人类语言的技术,而相关应用也早已深入日常生活中,像是电子邮件的筛选器、智慧助手、资料及文字分析等。
以 Apple 的 Siri 和 Amazon Alexa 这类的智慧助手为例,它们就是藉由语音识别功能辨识人类的指令,根据对话信息提供相对应的答案,协助用户有效处理各项事务。当然,随着物联网装置日益普及,智能助手的应用已逐渐扩大至企业层面,如同步会议记录、自动化虚拟客服等。

影像识别

影像识别,主要的目的是让电脑能从图像及视频中,进而提取信息,电脑通过深度学习进行数据理解,以协助人类进行数据判断的技术。图像识别领域是近年来深度学习发展中,相对蓬勃的区块,如产品瑕疵检测、医疗影像、智慧家居、人脸及车牌识别等应用,都能看到其身影。

深度学习会面临那些挑战?

虽然深度学习应用日益普及,但事实上,深度学习技术的推进仍面临挑战。

高质量的数据资料

深度学习的训练,是使用大量数据进行的过程,当数据越多,机器学习的模型越能跑出正确的结果。
不过值得注意的是,由于数据参杂异常或是错误信息,容易影响深度学习模型的判读,因此深度学习算法要能精准,需要大量高质量的资料训练才能得出更佳的解答。

软硬件运算能力

随着近年来AI技术日趋复杂,大量数据训练也成为模型性能好坏的关键。而训练的成效,除了高品质数据外,可提高数据处理效率的高性能GPU及处理单元,都是不可或缺的基础设施。