深度學習這個詞指的是訓練神經網絡。深代表著非常大的神經網絡。那么神經網絡到底是什么呢?看了這篇文章后你就會有很直觀的認識了。

我們從一個房價預測的例子開始吧。因為現在房價太他媽貴了,早8年前我父母說幫我在北京買個房,我覺得不能靠家里人,所以拒絕了,現在想想,我就是個傻逼,那時候買了,我現在就不用寫博客了~~

據說房價都是國人自己炒的,但除了炒作,還是有些真實因素影響著房價的,通過對這些因素進行分析,我們就可以預測房價。假設你有一個數據集(六個房屋的面積和價格)。你想要找到一個方法(即構建一個函數)來通過面積預測出價格。如果你熟悉線性回歸(不熟悉也沒關系,你就把它看作是一個數學理論),那么可以根據這個理論在實際數據附近畫出一條直線,如上圖中紅色的線,它附近的藍色的小圓圈代表著六個房子的面積與房價對應的點,即根據這條線(這個函數)來找某一個面積對應的房價,那么除了些誤差外,基本上是準的。另外我們知道價格永遠不會是負的,除非你是黑社會,占了別人的房子還要讓別人給你錢。所以,當面積為零,價格也為零,所以上面的直線要拐個彎。你可以把上面這個根據面積來預測價格的函數看作一個非常簡單的神經元網絡(這幾乎是最簡單的神經元網絡)。如右邊的圖,黃色的圈為一個神經元,房子的大小為x,它作為輸入進入這個神經元,然后神經元輸出房價y。
在神經網絡相關文獻中,你會經常看到這個函數(上面紅色的線)。這個函數在一定時間內為0,然后突然起飛飆升。它被稱為線性單元函數(ReLU ,全稱為rectified linear unit)。現在不懂沒有關系,后面慢慢就懂了!

上面用面積預測房價的例子是一個單神經元的小得不能再小的神經網絡,通過將多個這樣的神經元堆疊在一起就可以形成更大的神經網絡。你可以認為一個神經元就像一個積木塊,你可以通過將許多這樣的積木塊堆疊在一起來獲得一個更大的神經網絡。就房價的例子來說,如上圖,影響房價的因素不僅僅只有面積,還有例如臥室的數量。除了面積,臥室的數量也決定了房屋是否適合你的家庭,例如家里有3個人或5個人。另一個因素是郵政編碼。郵政編碼在這里代表了地理位置,地理位置繁華,那么生活會方便一些。然后還有一個因素是學校質量等級,在中國素有學區房一說。這些因素,我們也稱之為特征。根據面積以及臥室的數量,可以推算是否滿足家庭大小。根據郵政編碼,可以估算生活便利性,包括去學校的便利性。最后學校等級可以評估教育質量。人們在買房時會考慮這四個因素,即它們決定了房價,還有他媽的炒作,這里我們暫時忽略炒作這個因素吧。所以在這個例子中,x是代表了這4個輸入,y是要預測的價格。上面左圖是我們人為分析的過程,我們分析出哪些輸入會影響家庭大小的匹配度、生活便利性、教育質量,進而得出心中的價格。神經網絡之所以神奇的一點是,我們只需要提供輸入x(面積,臥室數量…)以及想要得到的結果y(房價),以及用于訓練的真實數據(上面六個房子的面積,臥室數量…以及價格),那么中間部分的家庭大小匹配度、生活便利性、教育質量都會由神經網絡自己根據實際數據訓練而得出,如右圖。當你再次輸入第7個房子的特征(面積,郵編…)后,這個神經網絡會根據之前訓練好的中間部分給出你最終的房價。即神經網絡的內部過程取代了人類的分析過程。再舉一個例子,例如當我們教小孩子認識貓時,我們拿來一些白貓,告訴他這是貓,再拿來一些黑貓,告訴他這也是貓,然后拿來一些狗,告訴他這不是貓,最后拿來一些花貓,問他,他會告訴你這是貓,但是他是怎么知道的?這個中間的判斷過程是怎么樣的?我們不知道。這就是為什么說神經網絡很恐怖的原因——它的工作原理太像人類了——我們都不知道它內部具體是如何運作的,即我們不知道它是怎么想的,就像我們不知道小孩具體是如何分辨貓和狗的。馬斯克說人工智能很危險,可能會毀滅人類也不無道理。
新聞熱點
疑難解答