獵豹CEO傅盛：深度學習是什麼？怎麼理解它的重要性？

推薦人：來源: 閱讀: 2.72W 次大中小

深度學習是什麼？

作者：獵豹CEO傅盛
摘自：百度百家

人工智能，就好像第四次工業革命，正從學術界的私藏，轉變爲一種能夠改變世界的力量。尤其，以深度學習取得的進步爲顯著標志。它讓匍匐前進60年的人工智能一鳴驚人。我們正降落到一片新大陸。深度學習帶來的這場重大技術革命，有可能顛覆過去20年互聯網對技術的認知，實現技術體驗的跨越式發展。

那麼，深度學習到底是什麼？怎麼理解它的重要性？

我們先從概念和現象入手。我總結了一句話，學術上看未必嚴謹，但從我的理解角度看——深度學習是基於多層神經網絡的，海量數據爲輸入的，規則自學習方法。

這裏包含了幾個關鍵詞：

第一個關鍵詞叫多層神經網絡。

深度學習所基於的多層神經網絡並非新鮮事物，甚至在80年代被認爲沒前途。但近年來，科學家們對多層神經網絡的不斷算法優化，使它出現了突破性的進展。以往很多算法是線性的。而這世界上大多數事情的特徵是複雜非線性的。比如貓的圖像中，就包含了顏色、形態、五官、光線等各種信息。深度學習的關鍵就是通過多層非線性映射將這些因素成功分開。

那爲什麼要深呢？多層神經網絡比淺層的好處在哪兒呢？

簡單說，就是可以減少參數。因爲它重複利用中間層的計算單元。我們還是以認貓爲例好了。它可以學習貓的分層特徵：最底層從原始像素開始學習，刻畫局部的邊緣和紋；中層把各種邊緣進行組合，描述不同類型的貓的器官；最高層描述的是整個貓的全局特徵。它需要超強的計算能力，同時還不斷有海量數據的輸入。特別是在信息表示和特徵設計方面，過去大量依賴人工，嚴重影響有效性和通用性。深度學習則徹底顛覆了“人造特徵”的範式，開啓了數據驅動的“表示學習”範式——由數據自提取特徵，計算機自己發現規則，進行自學習。

你可以理解爲——過去，人們對經驗的利用，靠人類自己完成。在深度學習呢？經驗，以數據形式存在。因此，深度學習，就是關於在計算機上從數據中產生模型的算法，即深度學習算法。

問題來了，幾年前講大數據，以及各種算法，與深度學習有什麼區別呢？

過去的算法模式，數學上叫線性，x和y的關係是對應的，它是一種函數體現的映射。但這種算法在海量數據面前遇到了瓶頸。國際上著名的ImageNet圖像分類大賽，用傳統算法，識別錯誤率一直降不下去，上深度學習後，錯誤率大幅降低。在2010年，獲勝的系統只能正確標記72%的圖片；到2012年，多倫多大學的 Geoff Hinton利用深度學習的新技術，帶領團隊實現了85%的準確率。2015年的ImageNet競賽上，一個深度學習系統以96%的準確率第一次超過了人類（人類平均有95%的準確率）。

計算機認圖的能力，已經超過了人。尤其圖像和語音等複雜應用，深度學習技術取得了優越的性能。爲什麼呢？其實就是思路的革新。

舉幾個腦洞大開的例子。

先說計算機認貓。我們通常能用很多屬性描述一個事物。其中有些屬性可能很關鍵，很有用，另一些屬性可能沒什麼用。我們就將屬性被稱爲特徵。特徵辨識，就是一個數據處理的過程。傳統算法認貓，也是標註各種特徵去認。就是大眼睛，有鬍子，有花紋。但這種特徵寫着寫着，有的貓和老虎就分不出來，狗和貓也分不出來。這種方法叫——人制定規則，機器學習這種規則。

深度學習方法怎麼辦呢？直接給你百萬張圖片，說這裏有貓，再給你上百萬張圖，說這裏沒貓。然後再訓練一個深度網絡，通過深度學習自己去學貓的特徵，計算機就知道了，誰是貓。

當前位置

獵豹CEO傅盛：深度學習是什麼？怎麼理解它的重要性？

相關文章

欄目導航

熱點閱讀

推薦閱讀