當前位置

首頁 > 勵志語句 > 經典的句子 > 獵豹CEO傅盛:深度學習是什麼?怎麼理解它的重要性?

獵豹CEO傅盛:深度學習是什麼?怎麼理解它的重要性?

推薦人: 來源: 閱讀: 2.72W 次

獵豹CEO傅盛:深度學習是什麼?怎麼理解它的重要性?

深度學習是什麼?

作者:獵豹CEO傅盛
摘自:百度百家

人工智能,就好像第四次工業革命,正從學術界的私藏,轉變爲一種能夠改變世界的力量。尤其,以深度學習取得的進步爲顯著標志。它讓匍匐前進60年的人工智能一鳴驚人。我們正降落到一片新大陸。深度學習帶來的這場重大技術革命,有可能顛覆過去20年互聯網對技術的認知,實現技術體驗的跨越式發展。

那麼,深度學習到底是什麼?怎麼理解它的重要性

我們先從概念和現象入手。我總結了一句話,學術上看未必嚴謹,但從我的理解角度看——深度學習是基於多層神經網絡的,海量數據爲輸入的,規則自學習方法。

這裏包含了幾個關鍵詞:

第一個關鍵詞叫多層神經網絡。

深度學習所基於的多層神經網絡並非新鮮事物,甚至在80年代被認爲沒前途。但近年來,科學家們對多層神經網絡的不斷算法優化,使它出現了突破性的進展。以往很多算法是線性的。而這世界上大多數事情的特徵是複雜非線性的。比如貓的圖像中,就包含了顏色、形態、五官、光線等各種信息。深度學習的關鍵就是通過多層非線性映射將這些因素成功分開。

那爲什麼要深呢?多層神經網絡比淺層的好處在哪兒呢?

簡單說,就是可以減少參數。因爲它重複利用中間層的計算單元。我們還是以認貓爲例好了。它可以學習貓的分層特徵:最底層從原始像素開始學習,刻畫局部的邊緣和紋;中層把各種邊緣進行組合,描述不同類型的貓的器官;最高層描述的是整個貓的全局特徵。它需要超強的計算能力,同時還不斷有海量數據的輸入。特別是在信息表示和特徵設計方面,過去大量依賴人工,嚴重影響有效性和通用性。深度學習則徹底顛覆了“人造特徵”的範式,開啓了數據驅動的“表示學習”範式——由數據自提取特徵,計算機自己發現規則,進行自學習。

你可以理解爲——過去,人們對經驗的利用,靠人類自己完成。在深度學習呢?經驗,以數據形式存在。因此,深度學習,就是關於在計算機上從數據中產生模型的算法,即深度學習算法。

問題來了,幾年前講大數據,以及各種算法,與深度學習有什麼區別呢?

過去的算法模式,數學上叫線性,x和y的關係是對應的,它是一種函數體現的映射。但這種算法在海量數據面前遇到了瓶頸。國際上著名的ImageNet圖像分類大賽,用傳統算法,識別錯誤率一直降不下去,上深度學習後,錯誤率大幅降低。在2010年,獲勝的系統只能正確標記72%的圖片;到2012年,多倫多大學的 Geoff Hinton利用深度學習的新技術,帶領團隊實現了85%的準確率。2015年的ImageNet競賽上,一個深度學習系統以96%的準確率第一次超過了人類(人類平均有95%的準確率)。

計算機認圖的能力,已經超過了人。尤其圖像和語音等複雜應用,深度學習技術取得了優越的性能。爲什麼呢?其實就是思路的革新。

舉幾個腦洞大開的例子。

先說計算機認貓。我們通常能用很多屬性描述一個事物。其中有些屬性可能很關鍵,很有用,另一些屬性可能沒什麼用。我們就將屬性被稱爲特徵。特徵辨識,就是一個數據處理的過程。傳統算法認貓,也是標註各種特徵去認。就是大眼睛,有鬍子,有花紋。但這種特徵寫着寫着,有的貓和老虎就分不出來,狗和貓也分不出來。這種方法叫——人制定規則,機器學習這種規則。

深度學習方法怎麼辦呢?直接給你百萬張圖片,說這裏有貓,再給你上百萬張圖,說這裏沒貓。然後再訓練一個深度網絡,通過深度學習自己去學貓的特徵,計算機就知道了,誰是貓。