Part 1
機器學習概覽

什麼是機器學習?
機器學習和人工智能的關係
機器學習的工作方式

機器學習所處的位置

傳統編程:軟件工程師編寫程序來解決問題。首先存在一些數據→為了解決一個問題,軟件工程師編寫一個流程來告訴機器應該怎樣做→計算機遵照這一流程執行,然後得出結果
統計學:分析師比較變量之間的關係
機器學習:數據科學家使用訓練數據集來教計算機應該怎麼做,然後系統執行該任務。首先存在大數據→機器會學習使用訓練數據集來進行分類,調節特定的算法來實現目標分類→該計算機可學習識別數據中的關係、趨勢和模式
智能應用:智能應用使用人工智能所得到的結果,如圖是一個精準農業的應用案例示意,該應用基於無人機所收集到的數據
機器學習的實際應用

快速三維地圖測繪和建模:要建造一架鐵路橋,PwC的數據科學家和領域專家將機器學習應用到了無人機收集到的數據上。這種組合實現了工作成功中的精準監控和快速反饋。
增強分析以降低風險:為了檢測內部交易,PwC將機器學習和其它分析技術結合了起來,從而開發了更為全面的用戶概況,並且獲得了對複雜可疑行為的更深度了解。
預測表現最佳的目標:PwC使用機器學習和其它分析方法來評估 Melbourne Cup 賽場上不同賽馬的潛力。
Part 2
機器學習的演化

五大流派
符號主義:使用符號、規則和邏輯來表徵知識和進行邏輯推理,最喜歡的算法是:規則和決策樹
貝葉斯派:獲取發生的可能性來進行概率推理,最喜歡的算法是:樸素貝葉斯或馬爾可夫
聯結主義:使用概率矩陣和加權神經元來動態地識別和歸納模式,最喜歡的算法是:神經網絡
進化主義:生成變化,然後為特定目標獲取其中最優的,最喜歡的算法是:遺傳算法
Analogizer:根據約束條件來優化函數(儘可能走到更高,但同時不要離開道路),最喜歡的算法是:支持向量機
演化的階段

1980年代 ——主導流派:符號主義,架構:服務器或大型機,主導理論:知識工程,基本決策邏輯:決策支持系統,實用性有限
1990年代到2000年 ——主導流派:貝葉斯,架構:小型服務器集群,主導理論:概率論,分類:可擴展的比較或對比,對許多任務都足夠好了
2010年代早期到中期 ——主導流派:聯結主義,架構:大型服務器農場,主導理論:神經科學和概率,識別:更加精準的圖像和聲音識別、翻譯、情緒分析等
流派有望合作融合到一起

2010年代末期 ——主導流派:聯結主義+符號主義,架構:許多雲,主導理論:記憶神經網絡、大規模集成、基於知識的推理,簡單的問答:範圍狹窄的、領域特定的知識共享
2020年代+ ——主導流派:聯結主義+符號主義+貝葉斯+……,架構:雲計算和霧計算,主導理論:感知的時候有網絡,推理和工作的時候有規則,簡單感知、推理和行動:有限制的自動化或人機交互
2040年代+ ——主導流派:算法融合,架構:無處不在的服務器,主導理論:最佳組合的元學習,感知和響應:基於通過多種學習方式獲得的知識或經驗採取行動或做出回答
Part 3
機器學習的算法
決策樹
Decision Tree
支持向量機
Support Vector Machine

回歸
Regression
樸素貝葉斯分類
Naive Bayes Classification

隱馬爾可夫模型
Hidden Markov model
隨機森林
Random forest

循環神經網絡
Recurrent neural network
長短期記憶與門控循環單元神經網絡
LSTM& GRU nerual network

卷積神經網絡
convolutional neural network