毫無疑問,近些年機器學習和人工智能領域受到了越來越多的關注。隨著大數據成為當下工業界最火爆的技術趨勢,機器學習也借助大數據在預測和推薦方面取得了驚人的成績。比較有名的機器學習案例包括Netflix根據用戶歷史瀏覽行為給用戶推薦電影,亞馬遜基于用戶的歷史購買行為來推薦圖書。
那么,如果你想要學習機器學習的算法,該如何入門呢?就我而言,我的入門課程是在哥本哈根留學時選修的人工智能課程。老師是丹麥科技大學應用數學和計算機專業的全職教授,他的研究方向是邏輯學和人工智能,主要是用邏輯學的方法來建模。課程包括了理論/核心概念的探討和動手實踐兩個部分。我們使用的教材是人工智能的經典書籍之一:PeterNorvig教授的《人工智能——一種現代方法》,課程涉及到了智能代理、基于搜索的求解、對抗搜索、概率論、多代理系統、社交化人工智能,以及人工智能的倫理和未來等話題。在課程的后期,我們三個人還組隊做了編程項目,實現了基于搜索的簡單算法來解決虛擬環境下的交通運輸任務。
我從課程中學到了非常多的知識,并且打算在這個專題里繼續深入學習。在過去幾周內,我參與了舊金山地區的多場深度學習、神經網絡和數據架構的演講——還有一場眾多知名教授云集的機器學習會議。最重要的是,我在六月初注冊了Udacity的《機器學習導論》在線課程,并且在幾天前學完了課程內容。在本文中,我想分享幾個我從課程中學到的常用機器學習算法。
機器學習算法通常可以被分為三大類——監督式學習,非監督式學習和強化學習。監督式學習主要用于一部分數據集(訓練數據)有某些可以獲取的熟悉(標簽),但剩余的樣本缺失并且需要預測的場景。非監督式學習主要用于從未標注數據集中挖掘相互之間的隱含關系。強化學習介于兩者之間——每一步預測或者行為都或多或少有一些反饋信息,但是卻沒有準確的標簽或者錯誤提示。由于這是入門級的課程,并沒有提及強化學習,但我希望監督式學習和非監督式學習的十個算法足夠吊起你的胃口了。
監督式學習
1.決策樹:
決策樹是一種決策支持工具,它使用樹狀圖或者樹狀模型來表示決策過程以及后續得到的結果,包括概率事件結果等。請觀察下圖來理解決策樹的結構。

從商業決策的角度來看,決策樹就是通過盡可能少的是非判斷問題來預測決策正確的概率。這種方法可以幫你用一種結構性的、系統性的方法來得出合理的結論。
2.樸素貝葉斯分類器:
樸素貝葉斯分類器是一類基于貝葉斯理論的簡單的概率分類器,它假設特征之前是相互獨立的。下圖所示的就是公式——P(A|B)表示后驗概率,P(B|A)是似然值,P(A)是類別的先驗概率,P(B)代表預測器的先驗概率。
新聞熱點
疑難解答