簡單來說,機器學習可以讓我們為那些人類無法做到的事情去找到解決方案,並創建相應的數學模型。與涵蓋探索性數據分析、統計學、通信技術以及可視化技術等內容的數據科學課程不同的是,機器學習課程只注重教授機器學習算法,即它們如何以數學的方式運作,以及我們要如何在編程語言中使用它們。為此,LearnDataScience 為大家推薦了 5 個最值得投入時間與精力的機器學習課程,雷鋒網 AI 科技評論將之編譯如下。
首先讓我們對今年 Top 5 的機器學習課程進行簡要回顧:
Machine Learning(機器學習) - Coursera
網址:https://www.coursera.org/learn/machine-learning
Deep Learning Specialization(深度學習專項課程) - Coursera
網址:https://www.coursera.org/specializations/deep-learning
Machine Learning with Python(基於 Python 的機器學習) - Coursera
網址:https://www.coursera.org/learn/machine-learning-with-python
Advanced Machine Learning Specialization(進階版機器學習專項課程) - Coursera
網址:https://www.coursera.org/specializations/aml
Machine Learning(機器學習) - EdX
怎樣才算是優質的機器學習課程?
經過多年沉浸於線上學習並參加了無數的機器學習課程(Coursera、 Edx、 Udemy、 Udacity、DataCamp 等)后,我將我當下認為最棒的機器學習課程進行了匯總。
在這張表單里,所有課程都滿足了以下幾點:
專註於機器學習
使用免費、開源的編程語言,如 Python、R 語言或者 Octave
使用免費、開源的語言庫。使用商業庫的課程將被排除在外
擁有供線下進行練習與實踐的編程作業
詳細解釋那些算法是如何以數學的方式運作的
學生可按個人需求靈活安排學習進度
有魅力的督導以及有趣的講座
在行業網站與論壇中獲得高於平均水平的打分和反饋
按照這些標準,我們很快淘汰了一部分課程,目標是為了找到一個值得你投入時間與精力的課程。
為了讓你沉浸其中,並儘可能快速全面地掌握機器學習,我認為除了線上學習以外,你還應該多看各種書籍。以下這兩本書籍就對我的學習經歷產生過重大影響:
《 Introduction to Statistical Learning 》(統計學習簡介)
免費獲取網址:http://www-bcf.usc.edu/~gareth/ISL/
本書提供了清晰、直接的釋義和示例,以提高你對基本機器學習技術的數學直覺。這本書更多地涉及理論方面的知識,但同時包含許多基於 R 語言的練習例子。
《 Hands-On Machine Learning with Scikit-Learn and TensorFlow 》基於 Scikit-Learn 和 TensorFlow 的手動機器學習
對前一本書進行了有效補充,主要關注如何使用 Python 創建機器學習應用。再結合任一學習課程,這本書將能有效強化你的編程技巧,並懂得如何快速將學習到的機器學習技術轉化為具體項目。
現在,讓我們一起看看關於 Top 5 課程的描述與評價:
Machine Learning(機器學習) - Coursera
網址:https://www.coursera.org/learn/machine-learning
不誇張的說,其他機器學習課程都將這門課程視為標杆。課程的講師與創建者是 Andrew Ng(吳恩達)——斯坦福大學教授、Google Brain 聯合創始人、Coursera 聯合創始人、曾將百度 AI 團隊培養成千人規模的副總裁。
該課程採用開源編程語言 Octave ,而非常規的 Python 或 R 語言來布置作業。這對於某些人而言可能有點標新立異,而事實上如果你是一名初學者,Octave 將是一個學習 ML 基礎知識的簡單方法。
總的來說,這門課程的材料非常全面,吳恩達也對此進行了詳盡講述。他將基於微積分解釋以及線性代數向你解釋算法背後的數學邏輯。這是一門獨立的學習課程,但如果能事先對線性代數有了解,對你學習這門課程將有很大的幫助。
課程提供者:斯坦福大學的 Andrew Ng(吳恩達)
費用:審核免費,證書要價 79 美元
課程大綱:
單變量的線性回歸
線性代數回顧
基於多個變量的線性回歸
Octave / Matlab 教程
邏輯回歸
正則化
神經網絡:表示
神經網絡:學習
對於運用機器學習的建議
機器學習系統設計
支持向量機
降緯
異常檢測
推薦系統
大規模的機器學習
應用示例:Photo OCR
課程將在十一周內傳授完畢。如果你能堅持完成課程,只需 4 個月,就能掌握機器學習的基礎知識。
此後,你可輕鬆選擇下一個專業主題課程,比如深度學習、機器學習工程或者任何能夠激起你學習興趣的內容。
毫無疑問,對初學者而言這是一門理想的起步課程。
Deep Learning Specialization(深度學習專項課程) - Coursera
網址:https://www.coursera.org/specializations/deep-learning
同樣是吳恩達主講,不同的是,這門專項課程屬於高階系列課程,適合那些有興趣學習神經網絡與深度學習、並利用它們來解決問題的人。
這門課程涉及神經網絡的作業和講座將採用 Python 語言以及 TensorFlow 庫。不用說,這是學習完吳恩達《機器學習》課程后的最佳延續,因為課程是你習慣的講解風格,只不過現在就需要你適應使用Python 來創建機器學習項目。
課程提供者:吳恩達、deeplearning.ai
費用:審核免費,證書要價 49 美元/月
課程大綱:
1.神經網絡與深度學習
深度學習簡介
神經網絡基礎知識
淺層神經網絡
深度神經網絡
2.神經網絡的改進:超參數調整、正則化與優化
深度學習的實踐
優化算法
超參數調整、批量標準化與編程框架
3.機器學習項目構建
機器學習策略(1)
機器學習策略(2)
4.卷積神經網絡
卷積神經網絡基礎
深度卷積模型:案例研究
物體檢測
特殊應用:人臉識別和神經風格轉移
5.序列模型
遞歸神經網絡
自然語言處理和 Word 嵌入
序列模型和注意機制
為了理解課程中的算法,你應該要熟悉線性代數和機器學習的通用知識。
Machine Learning with Python(基於 Python 的機器學習) - Coursera
網址:https://www.coursera.org/learn/machine-learning-with-python
又是一個針對初學者的課程,專註傳授那些最基本的機器學習算法。教師、幻燈片以及說明的完美結合,能讓你對基礎算法有最直觀的感受。
本課程採用的 Python,對算法背後的數學公式要求沒那麼高。 通過每個學習模塊,你將有機會利用瀏覽器中的 Jupyter notebook 對剛學過的概念進行實踐。 每個 notebook 將有效強化你之前的學習知識,同時提供在實際數據上進行算法實踐的具體說明。
課程提供者:IBM,Cognitive Class
價格:審核免費,證書要價 39 美元/月
課程大綱:
機器學習簡介
回歸
分類
聚類
推薦系統
課程項目
該課程的優點是會給每個算法提供實用的建議——每當引入一種新算法,講師會向你解釋它的工作原理、優缺點以及使用場景。這些經常會被其他課程所忽略,而這些信息對於初學者而言非常重要,因為這可以幫助他們了解算法背後的大背景。
Advanced Machine Learning Specialization(進階版機器學習專項課程) - Coursera
網址:https://www.coursera.org/specializations/aml
另一個高階系列課程, 如果你有興趣學習更多的機器學習技術,這是一門很關鍵的線上課程。
該課程的教學水平非常高:精彩又簡潔。由於課程的前沿性,您需要比其他課程擁有更紮實的數學基礎。如果你之前已經報讀過其他初學者課程,並擁有線性代數和微積分知識基礎,那麼這是你補充專業的機器學習知識的不錯選擇。
該課程涵蓋的大部分內容對於許多機器學習項目的實踐而言至關重要。
課程提供者:俄羅斯國立高等經濟學院
費用:審核免費,證書要價 49 美元/月
課程大綱:
1.深度學習簡介
優化簡介
神經網絡簡介
用於圖像的深度學習
無監督表示學習
序列深度學習
課程項目
2.如何在數據科學競賽中勝出:向頂級的 Kagglers 學習
介紹與回顧
模型的特徵處理與生成
課程項目描述
探索性數據分析
驗證
數據泄漏
度量標準優化
高級特徵工程 1
超參數優化
高級特徵工程 2
集成學習
比賽經歷
最終項目
3.機器學習的貝葉斯方法
貝葉斯方法和共軛引物簡介
期望最大化算法
變分推斷和隱狄利克雷分配模型(LDA)
馬爾可夫鏈蒙特卡羅
自動變分編碼器
高斯過程和貝葉斯優化
課程項目
4.強化學習實踐
簡介:與我何干?
強化學習核心:動態編程
無模型方法
基於近似值方法
基於政策方法
探索
5.計算機視覺中的深度學習
圖像處理和計算機視覺入門
視覺識別的卷積特徵
物體檢測
物體跟蹤與動作識別
圖像分割與合成
6.自然語言處理
前言、文本分類
語言建模和序列標記
語義向量空間模型
序列到序列任務
對話系統
7.利用機器學習方法應對大型強子對撞機挑戰
針對數據科學家的粒子物理入門
粒子識別
從稀有衰變中尋找新物理學
利用機器學習在新CERN實驗中尋找關於暗物質的提示
探測器優化
完成課程學習大約需要 8 到 10個月的時間,這也意味着如果是從今天開始學習,不到一年的時間裡,你將學到大量的機器學習知識,並能夠處理更多頂尖的應用程序。
此外,你將在這幾個月時間裡創建讓計算機懂得自行學習閱讀、查閱以及玩耍的項目。對未來的僱主而言,這些體現在 Github 上的項目將成為你履歷中漂亮的一環。
Machine Learning(機器學習) - EdX
網址:https://www.edx.org/course/machine-learning
相對而言其他課程而言,這是對數學能力要求最高的一門高階課程。這意味着你需要掌握牢固的線性代數、微積分、概率學和編程知識。該課程將基於 Python 或 Octave 布置有意思的編程作業,卻不會具體教授任一語言。
本課程最大的特點是對機器學習的概率方法進行了覆蓋。如果你對閱讀教科書(如《Machine Learning: A Probabilistic Perspective》.機器學習:概率學視角)很感興趣,那麼這門課將是很理想的補充。
課程提供者:哥倫比亞大學
費用:審核免費,證書要價 300 美元
課程大綱:
最大似然估計、線性回歸、最小二乘法
嶺回歸、偏差方差、貝葉斯規則、最大后驗推斷
最近鄰分類、貝葉斯分類器、線性分類器、感知器
邏輯回歸、拉普拉斯近似、核方法、高斯過程
最大邊距、支持向量機(SVM)、樹狀圖、隨機森林、提升
聚類、K 均值、EM 算法、缺失數據
高斯混合、矩陣分解
非負矩陣分解、潛在因子模型、PCA 和變化
馬爾可夫模型、隱馬爾可夫模型
連續狀態空間模型、關聯分析
型號選擇、後續步驟
該課程提到的許多主題都包含在其他針對初學者的課程里,然而數學元素卻未被淡化。如果你已經學習了基礎技術知識,同時有興趣深入研究數學,且希望從事實際推導出某種算法的編程作業,那麼本課程最合適不過。
via https://medium.com/@LearnDataSci/top-5-machine-learning-courses-for-2019-8a259572686e
雷鋒網 AI 科技評論