Michael I. Jordan 撰文:不要被深度學習一葉障目不見泰山

雷鋒網 AI 科技評論按:正如大家討論人工智能時經常把它和機器學習甚至深度學習近似等價,工業界和學術界的許多研究、開發人員們也往往過於關注深度學習,忽略了實際上範圍更廣的機器學習和人工智能領域還有許多有價值的問題等待研究。

近日,UC 伯克利大學電子工程與計算機學院和統計學院教授、機器學習領域的宗師、被稱為「人工智能界的邁克爾喬丹的」Michael I. Jordan 就發表了一篇文章,提醒大家不僅深度學習不是「人工智能」的全部,甚至我們日常討論的「人工智能」都不是真正意義上的「人工智能」的全部;這裡不僅有許多我們忽略了的問題,而且為了真正造福全人類,還有一個關於如何構建人工智能系統的新學科才剛剛萌芽、 等待建立。雷鋒網 AI 科技評論把這篇文章全文編譯如下。

人工智能(AI)是這個時代的人們的口頭禪,它被技術專家、學者、記者和投資者們一遍遍反覆念叨。就像以往許許多多先從技術學術領域出現再傳播到普羅大眾中的短語一樣,人們使用 AI 這個短語時存在嚴重的誤解。以往可能是因為公眾沒能理解科學家,但這次是科學家們和公眾一樣迷惑。這個時代出現和我們具有同等智力的硅基智慧的可能性讓我們所有人都覺得有趣,它既吸引我們又讓我們害怕。但是,它還會讓我們分心。

對於這個時代發生的事情,我想講一個視角獨特的故事。這個故事裡涉及到人類、計算機、數據和生死抉擇,但這裡的重點是硅基智能的幻想之外的一些東西。14 年前,當我的妻子懷孕時,我們做了超聲波檢查。為她檢查的遺傳學家指出胎兒心臟周圍有一些些白色斑點。「這些是唐氏綜合症的標誌,」她說,「患病風險已經上升到二十分之一了。」她進一步告訴我們,可以通過羊膜穿刺術檢查出胎兒是否帶有唐氏綜合症突變基因。但是羊膜穿刺術存在風險,在手術過程中胎兒的死亡率大約是三百分之一。

作為一名統計學家,我決定找出這些數字的來源。長話短說,我找到了一份來自英國的 10 年前的針對這一疾病的統計分析,其中認為這些白色的斑點反映了鈣的積累,是唐氏綜合症的預測因子之一。但我也注意到,檢查我妻子的成像機器比英國研究中使用的機器每平方英寸多幾百個像素。我就回去告訴遺傳學家,這些白色的斑點很可能是假陽性——它們實際上是「白噪音」。她說到,「啊,那我知道為什麼我們診斷出的唐氏綜合症幾年前一下子變多了,我們就是那個時候換的新機器。」

我們最終沒有做羊膜穿刺術,幾個月後,我們的女兒出生了,非常健康。但這件事讓我心中五味陳雜,尤其是在粗略計算之後,我確信,在醫生告訴我們診斷結果的那一天,全世界上有成千上萬的人得到了與我們相同的診斷結果,他們中的許多人選擇了羊膜穿刺術,許多嬰兒不必要地死去。這種事情每天都會發生,直到某一天人們找出原因。這一事件體現出的醫療問題並不是只有我一個人會遇到,這是整個醫療系統的問題 —— 在某一些時間地點測量變量、得出結果,進行統計分析,然後在其他時間地點使用這些結論。

準確地說,問題不僅在於數據分析本身,還在於數據庫研究人員所稱的「溯源(provenance)」—— 廣義上說,數據出現在哪裡,從數據中得出了什麼推論,以及這些推論與當前情況關聯性有多大?雖然一個受過專業訓練的人可能能夠針對每一種情況具體分析、具體解決,但真正需要解決的問題是全世界範圍使用的醫療系統如何在不需要精細的人類監督情況下就能做到這一點。

我也是一名計算機科學家,我突然意識到建立這種世界性規模的推理和決策系統的學科 —— 將計算機科學與統計學融合,並將人類經驗考慮在內 —— 從來就沒有任何學校教授過。我也意識到,不僅在醫學領域,在商務、運輸和教育等領域也類似,這種法則的建立至少與構建 AI 系統(讓我們眼花繚亂的遊戲 AI 和運動感知系統)同等重要。

無論我們能否在短時間內理解「智能」,我們都面臨著一個巨大的挑戰,那就是如何將計算機和人類結合,讓人類更好地生存。這一難題被一些人看作是「人工智能」的誕生,但我們也可以用平常心、以敬畏之心把它看作工程學科的一個新的分支。

就像幾十年前的土木工程和化學工程一樣,這個新學科的目標是集合一些關鍵思想的力量,安全地為人們帶來新的資源和能力。就像土木工程和化學工程是建立在物理理論和化學理論的基礎之上,這個新學科建立在我們在上個世紀中發現的思想之上,在諸如「信息」、「算法」、「數據」、「不確定性」、「計算」、「推理」和「優化」等概念之上。此外,由於這一學科的大部分重點都是來自於人類、關於人類的數據,它的發展也需要社會科學和人文學科提供幫助。

雖然這個學科的一些基礎理論已經逐漸出現,但把它們組合到一起的法則還不見蹤影。這些基礎理論之間現在就只能單個單個地產生聯繫、堆在一起。

就像土木工程學科出現之前人們就已經在造房子、造橋一樣,人們現在也是在沒有建立起新的學科的情況下,就在着手建造把機器、人類、環境都包含在內的全社會尺度的推理和決策系統。同樣地,就像早期的建築和橋樑有時會以完全無法預料的方式倒塌,造成悲劇的後果,我們許多早期的全社會尺度的推理和決策系統也已經暴露出了嚴重的觀念問題。

更難堪的是,我們人類並不是很擅長預測下一次會在哪裡出現嚴重問題。我們現在缺少它對應的工程學科,缺少其中的分析和設計的法則。

當下的公眾談起這些問題的時候總是用「人工智能」這個詞寬泛地囊括了所有和智慧相關的概念,這也就讓新出現的科學技術的影響範圍和後果變得很難討論。我們先仔細看看「人工智能」這個詞近期以及歷史上都表示過哪些含義吧。

如今的「人工智能」在大多數情況下所指的,尤其是在公眾討論中,就是過去的幾十年中我們稱作「機器學習 Machine Learning」的東西。機器學習是一門研究算法的學科,它從統計學、計算機科學和其它一些學科汲取了思想,用來設計能處理數據、做出預測、幫助人類決策的算法。至於對真實世界的影響,機器學習的影響是實實在在的,而且遠不止是近期才有影響。實際上,早在 1990 年代初的時候機器學習就已經表現出了明顯的跡象可以對工業界產生巨大的影響,到了二十一世紀,亞馬遜這樣的有前瞻性的公司就已經把機器學習用到了公司業務的上上下下當中,處理着詐騙檢測、邏輯鏈預測這樣的後端問題,也構建了推薦系統這樣的面向用戶的創新服務。隨着數據集的大小和計算資源在過去的 20 年裡突飛猛進,我們現在可以清楚地看到,不只是亞馬遜,幾乎任何可以依據大規模數據做出決策的企業都很快會把機器學習作為動力。新的商業模式會湧現。也已經出現了「數據科學」這個短語用來稱呼這種現象,其中反應的就是機器學習算法專家和數據庫、分佈式系統專家攜手構建可拓展的、魯棒的機器學習系統的需求,也反應了這樣的系統對更大的社會和環境範圍的影響。

在過去的幾年裡,這種思想和技術潮流的融合也被我們稱作了「人工智能」。然而這種稱呼是值得我們仔細審視的。

歷史上來說,人們在 50 年代末產生了一股用軟硬件共同重現出人類水平智慧的熱情,同時也創造出了「人工智能」/「AI」這個詞。這種志向我們可以稱為仿人類人工智能(human-imitative AI),在這種觀念里具有人造智慧的實體應當被看作我們的夥伴,即便看上去不像,精神上也應當像。這很大程度上可以看作學術研究領域的一種野心。一些相關的學術領域當時就已經存在,比如運籌學、統計學、模式識別、信息學和控制學這些學科,而且他們也經常從人類的智慧(以及動物的智慧中)獲得啟發,但一定程度上這些學科都關注的是「低層次」的信號和決策。比如說一隻松鼠理解它所居住的森林的三維結構的能力、在樹枝間跳躍的能力,都對這些學科有啟發作用。而「人工智能」應當關注的是另一些東西,是人類推理、思考中的「高層次」的、「認知性」的能力。一晃六十年過去了,高層次的推理和思考能力我們仍然捉摸不到。如今被稱作人工智能的技術進步基本都來自於低層次模式識別、運動控制相關的工程領域,以及在數據中尋找模式,據此做出預測、驗證猜想和決策的統計領域。

實際上,David Rumelhart 在八十年代重新發現的、如今被看作是所謂「人工智能革命」的核心的反向傳播算法,最早在五六十年代就出現在了控制領域。當時它最早的應用之一就是為阿波羅飛船計算飛向月球時的推力。

六十年代以來,我們的技術有了許多突破性發展,但是很大程度上這些進步並不是來自於對仿人類人工智能的追求的。倒不如說,就像阿波羅飛船的這個例子里一樣,這些思想都是隱藏在幕後的,是嘗試解決一些非常具體的工程挑戰的研究人員們的研究成果。雖然一般大眾看不到,但在文檔索引、文本分類、腐敗監控、推薦系統、個性化搜索、社交網絡分析、規劃、診斷和 A/B 測試方面的研究和系統構建都非常的成功;谷歌、Netflix、Facebook、Amazon 這些大公司的驅動力也正是這樣的技術進步。

現在我們會簡單地把上面這些東西全都統稱為「人工智能」,看上去也似乎確實是那麼回事。對於優化或者統計領域的研究員來說,這種歸類方式算是一個不大不小的驚喜,他們一下子就變成了「人工智能研究員」。但除了研究員的歸類問題之外,更大的問題是這種單個的、定義得並不准確的縮寫詞彙會阻止我們清晰地理解當下大規模的智能化和商業化問題。

過去的 20 年裡我們有許多重大突破,工業界和學術界也一同創造出了一種新的思維,作為仿人類人工智能的補充;我們常常把它稱作「智慧增強」(Intelligence Augmentation)。在這裡,我們用計算能力和數據構建一些服務,它們可以增強人類的智力和創造能力。搜索引擎就可以看作是智慧增強的一個例子,它增強了人類的記憶能力、增強了人類對客觀事實的認識;自然語言翻譯也是這樣,它增強了人類的溝通的能力。基於電腦的聲音和圖像生成也可以成為藝術家創作時的調色板和創新思想的增強。不過,雖然這樣的服務最終不可避免地會涉及到高層級的推理和思維能力,目前它們卻在這方面是一篇空白:它們所做的只不過是通過各種各樣的字符串匹配和數值計算找到一些人類可以加以利用的模式而已。

這裡我還需要再提出一個概念,就是廣義地認識到「智慧基礎設施」(Intelligent Infrastructure)這個學科。它是指一種計算能力、數據和相關的物理實體組成的網絡,這個網絡可以讓人類的生存環境對人類更有幫助性、更有趣、也更安全。這樣的基礎設施已經在物流運輸、醫藥、商業和金融這樣的領域顯露頭角,影響到了無數的個人和社會活動。有時候人們談起物聯網(IoT)也會提起某種網絡的建立,不過物聯網領域的網僅僅是把「物」連接到了「網」上而已,對於如何讓這些「物」處理數據流、發現關於世界的信息、與人類互動等等超越 0 和 1 組成的數據的高級抽象問題完全沒有觸及。

比如我可以再講一個自己的想法,我們可能幻想過生活在一個「全社會尺度的醫療系統」中,它會設置好醫生和病人身邊的醫療設備間的數據流和數據分析流,從而在疾病診斷和醫療護理中為人類的智慧提供幫助。這個系統可以收集身體細胞中的信息、DNA 中的信息、血液診斷中的信息、環境、群體遺傳學以及關於藥物和醫療方法的海量文獻中的信息,然後把它們集成在一起。它關注的不是單個病人和醫生,而是所有人類之間的關係,就像現代的醫學實驗是在某一部分人身上(或者動物身上)做實驗,然後用依據實驗結果醫治別的人。同樣,就像現代銀行系統可以在金融和支付領域中注重關聯性、可追溯性和可靠性這些問題一樣,這個醫療系統也最好可以注重這些理念。並且,雖然我們可以預見到構建這樣的系統會遇到各種各樣的問題,包括隱私問題、責任問題、安全問題等等,但這些問題都應當被正確看待為等待解決的挑戰,而不是阻止構建這樣系統的理由。

我們現在就遇到了這樣一個關鍵問題:面對這些更大的挑戰,研究仿人類人工智能是應對它們的最好的方法,甚至是唯一的方法嗎?機器學習領域最常被提起的成功故事裡有不少就是和仿人類人工智能相關的,比如在計算機視覺、語音識別、遊戲 AI 和機械人領域。所以似乎看起來我們就只要等着這樣的領域裡不斷出現新的進步就好了。

在這裡我想指出兩件事。一,雖然報紙上不會這樣講,但仿人類人工智能方向的研究實際上有很大限制,我們距離達到真正的仿人類人工智能的目標還非常遠。不幸的是,仿人類人工智能領域的有限的進步也很容易引發人們的激動(以及恐懼),這讓這個方向的研究本身過於火熱、媒體關注也過多。任何其它的工程領域都看不到這樣的現象。二,而且更重要的是,如果是為了解決重要的智慧增強和智慧基礎設施問題,那麼仿人類人工智能相關領域的成功既不充分也不必要

對於充分性這一邊,可以想想自動駕駛汽車。為了實現這樣的技術,等待解決的一系列工程問題和人類勝任駕駛的程度(以及人類不勝任駕駛的程度)幾乎沒有任何關係。一個總體性的交通運輸系統(一個智慧基礎設施)會非常接近現代的空中管制系統,而不太像目前的幾乎沒有分組的、前向的、漫不經心的人類司機的集合體。它將會比目前的空中管制系統複雜得多,尤其在於它可以利用海量數據和自適應性建模能力,做出細粒度決策。我們最先需要考慮的正是這樣的問題,而對於這樣的問題,仿人類人工智能方面的努力反倒會分散我們的注意力。

對於必要性,有一些人提出仿人類人工智能的願望其實包含了智慧增強和智慧基礎設施在內,因為仿人類人工智能將不僅可以解決各種經典 AI 問題(字面意思上,比如圖靈測試),而且它最有可能同時解決智慧增強和智慧基礎設施問題。這樣的觀點其實找不到什麼歷史先例作為支撐。土木工程的發展難道靠的是設想如何設計人造的粉刷匠和泥瓦匠嗎?難道化學工程的學科框架是如何創造出一個人造化學家?甚至更有意思的是,如果我們的目標是建造一個化學工廠,那我們難道應該要先造出一個人造化學家,然後讓它來思考如何建造一個化學工廠?

還有一種有關聯的觀點,是說人類智能是我們唯一知道的一種智能,我們發展人工智能的第一步就應當是嘗試模仿這種智能。但是實際上有一些類型的推理人類並不是很擅長,人類有很多失誤、偏見和限制。更重要的是,人類進化的目的就不是為了處理現代智慧基礎設施那樣的大規模決策問題的,也同樣不是為了處理智慧基礎設施環境下的不確定性問題的。有的人可能會說,一個人工智能系統將不僅可以模仿人類的智慧,而且還可以「糾正」它,當然也就可以拓展到任何大規模問題上去。但這樣的想法就跑到了科幻小說的領域去了,這樣的純粹猜想性的觀點當然符合科學幻想,但不應當作為我們面對逐漸顯現的重要的智能強化和智慧基礎設施問題時的主要策略。我們應當分別以它們應有的方式處理智能強化和智慧基礎設施問題,而不是僅僅當作仿人類人工智能目標的推論。

其實不難看到,智慧基礎設施系統中的算法和基礎設施挑戰並不是仿人類人工智能研究中的核心主題。智慧基礎設施需要的是管理快速變化的、而且很有可能全局不相干的分佈式知識存儲的能力。這樣的系統需要雲計算和邊緣計算之間的互動,才能做出即時的、分佈式的決策;而且還需要能夠處理數據中的長尾現象,即關於某一些個體有很多的數據,但大多數個體都只有很少的數據。它們需要能處理在穿越管理性和競爭性的邊界分享數據的問題。最後,而且也非常重要的是,智慧基礎設施系統需要把動機和定價這樣的經濟學理念融入到連接了人與人、人與商品的統計和計算基礎設施中。這樣的智慧基礎設施系統就不僅僅是提供了服務,更重要的是它提供了市場。音樂、文學、新聞等一些領域就非常需要這樣的市場,其中的數據分析就可以吧創作者和消費者連接到一起。而這一切也都需要在進化出社會性的、符合道德的、合乎法律的前提之下。

當然了,經典的仿人類人工智能問題也仍然是重要的研究課題。但是,目前的人工智能研究都是藉助收集數據、藉助部署深度學習基礎架構,這些系統所展現出的模仿某一些非常專門的人類技術的能力、同時還無法在解釋其中的規律上起到什麼幫助的現狀,實際上分散了我們的注意力,讓我們忽視了經典人工智能中的許多開放性問題。這些問題包括:如何給能夠處理自然語言的系統增加意義和推理能力,如何推理和表示因果關係,如何開發出可計算的不確定性的表示方法,以及如何開發出能夠形式化並追尋長期目標的系統,等等。這些同樣都是仿人類人工智能中的經典目標,但在當下的「人工智能革命熱潮」中,我們很容易忘記這些問題都還沒有解決。

智能增強也依然是足夠關鍵的,在真實世界狀況的抽象推理這件事上,在可見的未來內計算機都不可能達到人類的水平。人類和計算機之間需要構建思考足夠深入的溝通方式才能解決我們最緊迫的問題。而且我們也希望用計算機把人類的創造力推向新的高度,而不是用計算機取代人類的創造力(各種意義上的)。

John McCarthy(約翰麥卡錫)在達特茅斯學院時提出了「人工智能」這個詞,當時明顯是為了把他和 Norbert Wiener(諾伯特維納)兩人的不同的研究目標區分開。Wiener 提出詞是「神經機械學」(cybernetics),以表示他對智能系統的憧憬是和運籌學、統計、模式識別、信息論和控制理論緊密相關的。McCarthy 則更看重的是智能和邏輯之間的聯繫。不過後來發生了有趣的反轉,目前正是 Wiener 闡述的智力目標統治了這個領域,但打的卻是 McCarthy 的旗號。(目前的現狀當然是暫時的;AI 領域的風向轉換得比其它領域快得多)

但對我們來說,McCarthy 和 Wiener 兩人的歷史視角我們都需要超越。

我們需要明白,如今普通大眾討論的這種專註於工業和學術中的很小一部分問題的人工智能,有極大的風險會讓我們不再注意到人工智能、智能增強和智慧基礎設施的全部範圍內的挑戰和問題。

這個範圍並不僅僅是關於某些關於超人類電腦的科幻夢想以及恐懼的,而更關注的是,隨着科學技術在人類的生活中越來越顯著、越來越有影響力,人類需要能夠理解和控制它。並且,在這種理解和控制中,所有人類都應該發出各自的聲音,而不是僅僅在了解技術的人之間進行討論。狹隘地只關注仿人類人工智能會讓很多應當被聽到的聲音無法聽到。

雖然業界公司會繼續不斷地帶來更多技術進步,學術界也要扮演好自己的關鍵角色。不是僅僅提供一些創新的技術思路就結束,而應該把計算學科、統計學科的研究者和值得傾聽的其它學科的研究者聯繫起來,尤其值得一提的是社會科學、認知科學以及人文學科。

另一方面,雖然人文學科和自然科學學科對我們的前進來說都非常重要,我們也應當牢記我們討論的內容是關於一個前所未見的尺度和範圍的工程項目,是這個社會需要構建一些新的人造物。這些人造物應當建造得符合承諾。我們都不希望在一些幫助醫療的、交通的、商務的系統建造完畢之後才發現它們其實不好使,發現它們其實會減少人類的壽命和幸福感。出於這種理念,正如我剛才強調過的,我們需要一種新的工程學科來引導這種數據向的、學習向的領域。雖然這中想法聽起來很不錯,但目前我們還無法真正地把它看作一門學科。

更進一步地,我們正在見證新的工程領域的出現,我們應該為此感到高興。「工程」這個詞經常被人們理解得很狹隘,不管是在學術界還是更多語境下,好像都隱喻着冷酷無情的機器、或者是失去人類的控制。但其實一門工程學科可以成為任何我們希望它成為的樣子。

現在這個時代,我們真的可以設想一種歷史上從未出現過的東西:一個新的以人為中心的工程學科。

我現在沒法給這個正在萌發的新學科給出一個名字,但如果「人工智能」/「AI」這個詞會作為這個學科的命名的詞根的話,我們一定要謹記這個詞根的極為有限的實際意義。讓我們放寬視野、收起狂熱,仔細地觀察觀察我們面前等待着的挑戰吧。

Michael I. Jordan

via Michael I. Jordan,雷鋒網 AI 科技評論編譯


想在手機閱讀更多電腦與科技資訊?下載【香港矽谷】Android應用
分享到Facebook
技術平台: Nasthon Systems