當 Google 談論機器學習時,它在談論什麼?

.. Google一年一度的開發者大會 I/O 2018,本周在硅谷隆重上演。這你已經知道了,關於大會報道,請移步這裡

開幕前一天,Google 在總部舉辦了一堂名為「機器學習 101」的人工智能課,嘗試用最接地氣的方法介紹谷歌在機器學習方面正在做的事情。

這堂課的老師克里斯汀·羅伯森 (Christine Robson) 是 Google AI(原 Google Research)研究員,主攻人機交互方向。

機器學習是人工智能這個龐雜範疇中的一個重要技術。「人工智能就是讓事物變聰明的科學,」羅伯森說。「機器學習技術則是製造能夠學習變聰明的機器。」

她用最簡單的語句概括 Google 眼中機器學習的定義:

機器學習就是一個新的解決問題的系統。

 

真的只是數學

首先我們需要理解舊系統和新系統的區別。舊的系統指的是基於規則的系統(rule-based system),需要程序員告訴機器一件事情的規則。

過去幾乎所有的程序都屬於基於規則,而告訴機器規則的過程就是編程。強大如曾經擊敗卡斯帕羅夫的深藍 (Deep Blue),也是基於規則的。但機器學習是通過新的算法,讓機器並不需要太多的編程就可以自動學習,自動創造解決問題的系統,

羅伯森使用了「自動」 (Automatically) 一詞,而非人工智能里的「人工」 (artificial) 。

這似乎是為了減少對後者的過分使用,避免因此帶來的人工智能「妖魔化」趨勢。Google 正意識到圍繞人工智能產生的負面效應。

在謝爾蓋·布林 (Sergey Brin) 署名的《創始人信》中,這位 Google 的聯合創始人提到了人工智能潛在的負面影響,包括對人工智能具有科幻般感知能力的恐慌,以及更近在眼前的,無人駕駛的穩定性問題等。

近兩年,人們對人工智能的恐懼明顯有所加深,而幾乎每一種對這種恐懼的描述中,都有 AlphaGo 的身影。不少人認為,機器學習創造的人工智系統,存在超越人類認知能力的可能性——大量不同算法的結合,可能會帶來一個只有機器可以理解的系統。

羅伯森並不這麼認為。她希望讓對這門學問不熟悉的人知道,「機器學習就只是數學,真的只是數學。而且還是最簡單的數學。」

機器學習都是建立在最簡單形式的線性代數基礎上的。「這麼說聽起來確實很嚇人。但我並不想嚇人。我並不認為機器學習系統很難理解。」

而對於機器學習系統會變成一個黑箱的觀點,也即大量不同算法融合進一個複雜系統后,人類無法確切知道系統內具體發生了什麼——她也認為是個常見的「誤解」,不熟悉的人和剛開始接觸機器學習者都會遇到。

「機器學習並非一個真的黑箱,如果你研究了一段時間,你會發現在神經網絡里,每個結果是可以確切回溯 (trace) 的。「

那麼,如何定義回溯?羅伯森認為並不需要準確找到具體哪一個原始數據出了問題。「Google 在這方面做了很多努力,確保我們清楚網絡里發生了什麼。你想知道輸出結果為何出錯的時候,把裡面的數學部分抽出來分析就行。」

 

貓咪無處不在

和互聯網以及社交網絡一樣,機器學習這個圈子裡,最有存在感的是貓。

羅伯森引用YouTube學習識別貓咪圖像的案例,來介紹了神經網絡通過多個層級來完成學習的過程,在強調 Google 擁有強大的計算能力時,羅伯森也用貓咪做例子:「Google 能夠分析網上所有貓咪圖片,儘管貓咪圖片的數量真是多的可怕。」

貓儼然成了讓機器學習走進人間的利器。「在 Google,我們很擅長關於貓的事情。」

 

醫學應用取得突破

不過,光有貓肯定不夠。「當我們把分析貓的技術,應用於其他領域,這就更加令人興奮。」羅伯森說。

目前,Google在機器學習方面最驕傲的應用領域是醫學。近幾年的 I/O 開幕演講中,CEO 頌達爾·皮柴 (Sundar Pichai) 經常提到機器學習幫助識別糖尿病視網膜病變的案例,該公司使用一個 26 層的卷積神經網絡進行訓練,得到的診斷敏感度和準確率都高於職業眼科醫生。

醫學領域不像貓一樣,Google 最初使用的圖像數據庫只有幾千張,但該公司的機器學習系統依然能夠取得令人滿意的結果,為醫生的診斷提供重要幫助和效率提升。比如在識別乳腺癌的研究中,Google 只用了 270 張圖片做訓練。

羅伯森形容自己是一個「Machine Learning person」,而 Google 給了她充足支持。「我的 CEO 對人工智能充滿激情,這也讓我對我的工作感到興奮。」

「Google 的目標是讓人工智能普及化,每個人都可以使用。」

羅伯森指出,Google 在機器學習和人工智能上所做的事情主要有三個:第一,讓 Google 的產品更加好用,這在今年 I/O 宣布的 Android、Google Assistant 等產品上有很強的體現;第二,把最尖端的技術開放給大眾,讓每個人都可以參與進來,這個目標通過 AutoML、ML Kit 等開發者工具實現了。

第三,就是為人類現在面對的問題帶來變革。人工智能很有可能是人類在漫漫的歷史長河中,迄今為止開發出的最重要的技術。就像人們掌握了取火和發電的能力那樣,人工智能將作為一種更高效率和變革性的存在,幫助人類解決被認為不可解決的難題,邁向更好的世界。

Google 的每一位人工智能研究者都對此堅信不疑。


想在手機閱讀更多電腦與科技資訊?下載【香港矽谷】Android應用
分享到Facebook
技術平台: Nasthon Systems