什麼是深度學習 ?

想理解深度學習(Deep Learning, DL),最簡單的解釋,可以將深度學習視為機器學習,若更進一步的定義,深度學習就是機器學習的進化版,是資料科學中的組成關鍵。
先來淺談機器學習的定義。機器學習是AI人工智慧的一種應用方法,透過大量的特徵資料來訓練AI模型,藉由學習的過程,不斷的縮小真值與預測結果的差異,讓AI模型最終能自行判斷出正確結果。
圖1. 深度學習包含在機器學習中
而深度學習,簡單來說就是包含在機器學習中,它與機器學習的差異在於,機器學習使用演算法來剖析資料,而深度學習是以「層次性」為演算法的基礎概念,透過模擬人腦的運作方式,創立人工神經網絡(Neural Network),形成數學函數的集合,只要將輸入的值丟入其中,經過大量的訓練過程,進行複雜運算,有效處理非結構化資料,最終機器可得出比擬人類的行為判斷。

深度學習是如何運作的 ?

圖2. 鳥圖
或許你會好奇,人工神經網絡的深度學習,又該如何運作的呢?

讓我們以幼兒學習為例。當家長要讓幼兒學習辨識鳥類圖像,以及發出鳥的發音,首先,家長會指著圖片中的鳥發出正確的音,隨後幼兒可能會陸續發出相似的發音,經過修正直到他們能理解這個字為止。而這種學習的過程,與人工神經網絡有異曲同工之妙。
其實人工神經網絡是一種多層級結構,由輸入層(input layer)、隱藏層(hidden layer)、輸出層(output layer)所建構而成,每一層都蘊含不同權重(weight)跟變數(parameter),以多節點分析圖片上的特徵,最低層計算像素的黑白對比,第二層則依據第一層資料分辨邊線等線條,通過層層非線性函數運算,最後將由輸出層產出終值,也就是圖片的分類與辨識。
圖3. 人工神經網絡
由於這類的神經網路需要多層神經元進行資料處理,透過一層一層的對比方能運行,運算複雜性相對高,而這也是為什麼,深度學習被賦予「深度」概念的原因。

為何深度學習很重要?

其實與AR一樣,深度學習並不是全新的科技概念。早1980年代深度學習就以不同概念被提出,但當時電腦運算能力不足,驗證成效不彰,直到近幾年高效能處理器的出現及硬體的進步,才大幅提升數值運算速率,慢慢讓外界將焦點轉移到深度學習上,至今相關研究及應用仍不斷推陳出新。
開發人員及資料科學家會利用深度學習程式,進行語音、圖像、文字等辨識,進而分析複雜且龐大的數據資料,間接推動許多日常AI應用,像是iPhone內建的Siri虛擬助理,就是仰賴深度學習技術而生的真實案例。

深度學習有哪些用途?

深度學習是近期熱門的AI技術,包含語音辨識、自然語言處理、影像識別等,舉凡各種和生活相關領域,都是其常見應用。

語音辨識

語音辨識(Speech Recognition)這項技術,最主要的目的是希望電腦能理解人類所說的話,讓電腦自動將語音內容轉成文字,並依據語音信號執行任務。現行較常見的語音辨識應用,包含語音文件檢索、聽寫資料錄入、語音導航、室內裝置控制等。

自然語言處理

自然語言處理(Natural Language Processing, NLP)是AI的分支,是可協助電腦理解、解釋急操縱人類語言的技術,而相關應用也早已深入日常生活中,像是電子郵件的篩選器、智慧助理、資料及文字分析等。
以Apple的Siri和Amazon Alixa這類的智慧助理為例,它們就是藉由語音識別功能辨識人淚的指令,根據對話資訊提供相對應的答案,協助用戶有效處理各人事務。當然,隨著物聯網裝置日益普及,智能助理的應用已逐漸擴大至企業層面,如同步會議記錄、自動化虛擬客服等。

影像識別

影像辨識,主要的目的在於讓電腦能從圖像及影片中,進而擷取資訊,電腦透過深度學習進行資料理解,以協助人類進行資料判斷的技術。影像辨識領域是近年深度學習發展中,相對蓬勃的區塊,如產品瑕疵檢測、醫療影像、智慧家居、人臉及車牌辨識等應用,都能看見其身影。

深度學習會面臨那些挑戰?

雖然深度學習應用日益普及,但事實上,深度學習技術的推進仍面臨挑戰。

高品質的數據資料

深度學習的訓練,是使用大量數據進行的過程,當數據越多,
機器學習的模型越能跑出正確的結果。
不過值得注意的是,由於資料參雜異常或是錯誤資訊,容易影響深度學習模型的判讀,因此深度學習演算法要能精準,需要大量高品質的資料訓練才能得出更佳的解答。

軟硬體運算能力

隨著近年AI技術日趨複雜,大量數據訓練也成為模型性能好壞的關鍵。而訓練的成效,除了高品質數據外,可提高數據處理效率的高性能GPU及處理單元,都是不可或缺的基礎設施。
相關文章
  • 什麼是OCR? OCR能夠做什麼應用?

    OCR技術對於企業的數位轉型有相當大的功勞,現今社會提倡無紙化概念,且用紙本保存貴重資料的舊有形式,已經無法再適用現今瞬息萬變的資訊化腳步,OCR在無紙化轉型之中就扮演了相當重要的角色,除此之外,OCR結合AI還可用於瑕疵檢測、車牌辨識、字跡辨識、自動識檢驗別等。
  • a close up of a semiconductor wafer being fabricated

    半導體行業中的3種常見自動化解決方案

    半導體行業在過去幾十年中迅速發展,變得越來越複雜和復雜,自動化已成為其中的一個重要方面。 自動化幫助半導體公司快速高效地生產高質量的產品,減少各種過程所需的時間, 提高準確性,減少錯誤,並降低勞動力成本,改善工人安全性。 在本文中,我們將探討半導體行業中三種最常見的自動化解決方案。
  • 1. 老舊設備 – 非侵入式資料擷取以及控制

    數位轉型實踐 – 設備智慧化結合AR創造商機

    台灣防疫固然有成,並且成功的讓產業所受到的衝擊降到最低,但在全球經濟轉變以及工作模式已經帶來全面性的改變:設備智慧化、零接觸經濟、遠距教學等需求逐步提升。因此在這後疫情時代下,從各面向進行數位轉型,並帶動經濟的發展,為產業帶來嶄新的機會!那究竟我們需要怎麼樣來實行呢?我們將會遇到哪些問題?
  • AI機器視覺是甚麼?原理與應用?看完這篇一次了解

    AI機器視覺是人工智慧的一個分支,使機器和人一樣「看懂」圖像與物件後進行判斷與決策,常用在工業自動化與機器人領域如: 視覺瑕疵檢測、3D視覺定位等,也是新興的AR + AI視覺系統技術核心。