什麼是深度學習 ?
想理解深度學習(Deep Learning, DL),最簡單的解釋,可以將深度學習視為機器學習,若更進一步的定義,深度學習就是機器學習的進化版,是資料科學中的組成關鍵。
先來淺談機器學習的定義。機器學習是AI人工智慧的一種應用方法,透過大量的特徵資料來訓練AI模型,藉由學習的過程,不斷的縮小真值與預測結果的差異,讓AI模型最終能自行判斷出正確結果。
圖1. 深度學習包含在機器學習中
而深度學習,簡單來說就是包含在機器學習中,它與機器學習的差異在於,機器學習使用演算法來剖析資料,而深度學習是以「層次性」為演算法的基礎概念,透過模擬人腦的運作方式,創立人工神經網絡(Neural Network),形成數學函數的集合,只要將輸入的值丟入其中,經過大量的訓練過程,進行複雜運算,有效處理非結構化資料,最終機器可得出比擬人類的行為判斷。
深度學習是如何運作的 ?
圖2. 鳥圖
或許你會好奇,人工神經網絡的深度學習,又該如何運作的呢?
讓我們以幼兒學習為例。當家長要讓幼兒學習辨識鳥類圖像,以及發出鳥的發音,首先,家長會指著圖片中的鳥發出正確的音,隨後幼兒可能會陸續發出相似的發音,經過修正直到他們能理解這個字為止。而這種學習的過程,與人工神經網絡有異曲同工之妙。
讓我們以幼兒學習為例。當家長要讓幼兒學習辨識鳥類圖像,以及發出鳥的發音,首先,家長會指著圖片中的鳥發出正確的音,隨後幼兒可能會陸續發出相似的發音,經過修正直到他們能理解這個字為止。而這種學習的過程,與人工神經網絡有異曲同工之妙。
其實人工神經網絡是一種多層級結構,由輸入層(input layer)、隱藏層(hidden layer)、輸出層(output layer)所建構而成,每一層都蘊含不同權重(weight)跟變數(parameter),以多節點分析圖片上的特徵,最低層計算像素的黑白對比,第二層則依據第一層資料分辨邊線等線條,通過層層非線性函數運算,最後將由輸出層產出終值,也就是圖片的分類與辨識。
圖3. 人工神經網絡
由於這類的神經網路需要多層神經元進行資料處理,透過一層一層的對比方能運行,運算複雜性相對高,而這也是為什麼,深度學習被賦予「深度」概念的原因。
為何深度學習很重要?
其實與AR一樣,深度學習並不是全新的科技概念。早1980年代深度學習就以不同概念被提出,但當時電腦運算能力不足,驗證成效不彰,直到近幾年高效能處理器的出現及硬體的進步,才大幅提升數值運算速率,慢慢讓外界將焦點轉移到深度學習上,至今相關研究及應用仍不斷推陳出新。
開發人員及資料科學家會利用深度學習程式,進行語音、圖像、文字等辨識,進而分析複雜且龐大的數據資料,間接推動許多日常AI應用,像是iPhone內建的Siri虛擬助理,就是仰賴深度學習技術而生的真實案例。
深度學習有哪些用途?
深度學習是近期熱門的AI技術,包含語音辨識、自然語言處理、影像識別等,舉凡各種和生活相關領域,都是其常見應用。
語音辨識
語音辨識(Speech Recognition)這項技術,最主要的目的是希望電腦能理解人類所說的話,讓電腦自動將語音內容轉成文字,並依據語音信號執行任務。現行較常見的語音辨識應用,包含語音文件檢索、聽寫資料錄入、語音導航、室內裝置控制等。
自然語言處理
自然語言處理(Natural Language Processing, NLP)是AI的分支,是可協助電腦理解、解釋急操縱人類語言的技術,而相關應用也早已深入日常生活中,像是電子郵件的篩選器、智慧助理、資料及文字分析等。
以Apple的Siri和Amazon Alixa這類的智慧助理為例,它們就是藉由語音識別功能辨識人淚的指令,根據對話資訊提供相對應的答案,協助用戶有效處理各人事務。當然,隨著物聯網裝置日益普及,智能助理的應用已逐漸擴大至企業層面,如同步會議記錄、自動化虛擬客服等。
影像識別
影像辨識,主要的目的在於讓電腦能從圖像及影片中,進而擷取資訊,電腦透過深度學習進行資料理解,以協助人類進行資料判斷的技術。影像辨識領域是近年深度學習發展中,相對蓬勃的區塊,如產品瑕疵檢測、醫療影像、智慧家居、人臉及車牌辨識等應用,都能看見其身影。
深度學習會面臨那些挑戰?
雖然深度學習應用日益普及,但事實上,深度學習技術的推進仍面臨挑戰。
高品質的數據資料
深度學習的訓練,是使用大量數據進行的過程,當數據越多,
機器學習的模型越能跑出正確的結果。
機器學習的模型越能跑出正確的結果。
不過值得注意的是,由於資料參雜異常或是錯誤資訊,容易影響深度學習模型的判讀,因此深度學習演算法要能精準,需要大量高品質的資料訓練才能得出更佳的解答。
軟硬體運算能力
隨著近年AI技術日趨複雜,大量數據訓練也成為模型性能好壞的關鍵。而訓練的成效,除了高品質數據外,可提高數據處理效率的高性能GPU及處理單元,都是不可或缺的基礎設施。