二十一世紀的計算 | 微軟亞洲研究院洪小文54頁PPT講述人工智能和人類智能的 「共進化」

雷鋒網按:本文根據洪小文在「二十一世紀的計算」學術研討會所做的報告《Co-Evolution of Artificial Intelligence and Human Intelligence》編輯整理而來,在未改變原意的基礎上略有刪減。

近日,「二十一世紀的計算」學術研討會在韓國首爾舉行。它是微軟亞洲研究院自成立之初便開始舉辦的年度學術盛會。作為中國及亞太地區規模最大、最具影響力的計算機科學教育與研究盛會之一,迄今為止該大會已在中國、日本、韓國、新加坡等多個國家和地區成功舉辦了17屆,參會人數累計超過40000人。 今年的「二十一世紀的計算」大會以「Human and Machine Working as a Team」(人機協作)為主題。

洪小文博士,現任微軟全球資深副總裁,微軟亞太研發集團主席,兼微軟亞洲研究院院長,全面負責推動微軟在亞太地區的科研及產品開發戰略,以及與中國及亞太地區學術界的合作。洪小文博士師從圖靈獎獲得者拉吉·瑞迪(Raj Reddy),而拉吉·瑞迪則是人工智能領域的奠基人和拓荒者約翰·麥卡錫(John McCarthy)的學生。洪小文博士從事人工智能相關研究近30年,是國際公認的語音識別專家。

昨天,洪小文博士在韓國進行了全英文演講,現場由劉鐵岩博士進行解讀。(劉鐵岩,微軟亞洲研究院首席研究員,美國卡內基梅隆大學(CMU)客座教授、英國諾丁漢大學榮譽教授、中國科技大學、中山大學、南開大學博士生導師。劉博士的研究興趣包括:人工智能、機器學習、信息檢索、數據挖掘等。)

他今天和大家分享的是Co-Evolution of Artificial Intelligence and Human Intelligence(人工智能和人類智能的「共進化」)。在這次演講中,洪小文博士描述了諸如計算機視覺和數據挖掘等人工智能已經證明超過人類能力的領域的研究進展。 他還將談論人類如何在創造力和判斷力方面做得更好。由於人工智能是可以增強人類能力的工具,因此明確技術可行和不可行的內容與原則也十分重要,從而最終保證人工智能能被恰當使用。

縱觀歷史,人類已經開發了幫助文明演變和成長的工具和技術。計算機及其擴展為人工智能的發展提供了重要作用。首先,洪小文博士講到了人工智能的3個不同的技術層面。

  • 視覺識別

  • 自然語言理解

  • 數據分析

| 計算機視覺識別

先說計算機視覺識別,過去微軟亞洲研究院在計算機視覺領域有着世界領先的研究成果,在去年的ImageNet比賽和今年的COCO比賽中都有非常亮眼的表現。關於ImageNet,2014獲勝的系統錯誤率為6.7%,而2015微軟的系統的錯誤率已經低至3.57%,超過了人類的識別水平。


另外,當時微軟亞洲研究院的研究員們在當時的ImageNet挑戰賽中使用了一種前所未有,深度高達152層的殘差神經網絡。

今年的COCO比賽,尤其是COCO比賽的物體分割(Instance Segmentation)任務, 見下圖。

相比於圖像識別,圖像細分技術的難度遠超人們想象。這項挑戰主要考察在圖像中確定某些具體對象的技術。像之前傳統的全卷積網絡雖然非常適合語義分割,它卻不適合圖像中的物體分割。

不過好在微軟研究院研發明了一種叫instance-aware fully convolutional network的算法。

最終,以比第二名高11%的絕對優勢奪冠。

最近我們研究院的同事把計算機視覺上的前沿技術也拓展到了視頻分析之中。

在video captioning方面也取得了非常好的結果。

到此,洪小文博士分享了微軟認知服務目前提供的5大類21種API。

| 自然語音理解

下面講自然語音理解部分。微軟的工程師基於微軟認知服務開發了各種各樣的人工智能應用,在自然語言處理方面,微軟小冰/Rinna是一個非常好的展示。小冰不僅重視問答,還關注和用戶的感情溝通。大家有空可以去試試~~

上圖從左至右分別是:How_old.net, twins or not.net, mymustache.net, 鬧鐘應用mimicker alarm 和caption robot。擁有了這些強大的人工智能API,開發者都不需要擁有人工智能或者機器學習背景,就可以開發出自己的有趣應用。

而且小冰還幫助一些網站做客戶服務,不僅帶來了很好的客戶滿意度,還提升了銷售量。也說明我們的自然語言處理技術不僅可以應用在聊天上,對於企業級的應用也有很好的支持。

這樣,就可以真正把開發者的精力解放出來,而只用集中在自己天馬行空的創意應用上~此前,在第四代小冰發佈后,我們還與敦煌研究院進行合作,推出了敦煌小冰服務。藉助自主知識學習技術(Doc Chat),小冰能夠在很短的時間內,迅速地從大量專業數據中學習相關領域的知識。

當然,除了小冰,我們在企業內部應用方面還有很多其他的新技術,比如自動會議助理EDI等。現在在微軟研究院內部,七、八成的會議都是通過這個人工智能助理來訂的,它可以用自然語言對話作為交互方式,自動尋找最合適的會議室和時間段,解決各種潛在的衝突。

| 數據分析

洪小文博士接下來分享了微軟在數據分析和數據可視化上的成果。

關於第三個層面的人工智能,小文提到的是business intelligence,介紹了微軟亞洲研究院在大數據分析方面的最新成果。

Power BI是微軟推出的在線服務,通過powerbi.com能夠讓你用最直觀的方法對數據進行處理,例如查找和呈現數據、在線共享數據、團隊協同合作,等等。

BI即商業智能(Business Intelligence, BI)。微軟亞洲研究院的軟件分析組(Software Analytics Group)和微軟總部的Power BI產品團隊在過去兩年內有着非常密切的合作。去年我們推出了Quick Insights幫你智能地洞察大數據背後的秘密,今天我們和Power BI 共同推出了Infographic Designer, 幫你迅速將數據變為可視化的圖片。

上圖是副院長張益肇博士在演示AnnaTalk技術,可以根據用戶輸入的自然語言查詢,對相關數據進行複雜的分析,生成圖表,提供洞察。

微軟亞洲研究院軟件分析組的研究工作可以分為應用領域和基礎研究領域。從應用領域來說,軟件分析組以軟件為研究對象,主要採用數據驅動的方式解決三個方面的問題,

  • 一是軟件系統的質量(Quality),如可靠性、性能、以及安全性等;

  • 二是用戶體驗(Experience),如用戶界面、用戶使用方式、以及用戶黏度,等等;

  • 最後是軟件開發效率(Productivity)。

為了解決這些應用領域中的問題,我們需要在一些基礎研究領域內有相應的技術支撐,包括大規模數據存儲與計算、各種數據分析算法、以及信息可視化。Anna Talk也是軟件分析組的秘密黑科技~猜猜Anna是誰的名字。

| 人工智能和人類智能的共進化

介紹完了微軟亞洲研究院在三個層面上的人工智能研究成果以後,洪小文博士開始探討人工智能更深層次的問題,以及它和人類智能的共進化。

我們現有的資源與之前可謂不同日而語——部署在雲端的海量計算資源已經像水和電一樣唾手可得了;互聯網所容納的信息也遠遠超過了過去幾千年來人們所有的知識儲備;以深度學習等為代表的機器學習算法的發展,也讓計算機能夠從這些龐大的數據中獲取知識。

洪小文博士指出,人類智能的優越性在於從小樣本中、甚至0樣本中進行學習和推理。而以深度學習為代表的人工智能技術則更適合從大數據中學習。

下面向大家提出了一個問題, 人工智能中的「智能」究竟指什麼呢?洪小文博士將智能分為四個階段。

  • 第一級,功能(Capability)。功能是工具的價值點,對於人類最有意義,也一直推動着人類社會的進步。從石刀石斧、鼎鑊簋盂、塤箏鐘磬到今天的跑車、游輪、客機,工具萬千,各有所用。

  • 第二級,智能(Intelligence)。有趣的是,「智能」的概念是跟着時代的發展而不斷改變的。記憶力是一種智能嗎?倒退幾百年的話,顯然是。科舉、八股文所考察的首先是應試者對古老經典全局與細節的記憶。算術是一種智能嗎?曾經是——《水滸傳》里有位好漢叫神算子蔣敬,職司梁山錢糧支出納入,可說是梁山一百單八將里少見的頭腦與肌肉兼具的人才。下棋是一種智能嗎?當然是。雄踞國際象棋第一高手寶座時間最長的棋手加里-卡斯珀羅夫曾被譽為「全世界最聰明的人」——但在今天,說起記憶力、算數和弈棋(不包括圍棋),計算機比人類更在行,但大部分人可能不會認為這些有多高智能多了不起。另外,IQ(Intelligence Quotient)測試是個有趣的話題——由於測試全程通常都會給出各種選項,機器在應對這種智能商數的挑戰時其實是有很大的幾率得高分的,我猜測,未來十年內,將會出現IQ測試拿最高分的機器。

  • 第三級,智力(Intellect)。智力比智能更高一籌,「力」這個字里包含了判斷力、創造力等信息。對人類來說,每天我們面對的大多都不是選擇題,又或是有着無窮選項的選擇題。例如,我在微軟亞洲研究院的日常工作,大部分都不是非此即彼的選擇——一個研究團隊需要補充人手,我不能簡單地回答「可以」或「不可以」,而是要結合實際情況,包括預算、課題、團隊現狀、發展前景等多方面的因素,來判斷團隊是否真的急需補人、補多少人和什麼樣的人,或者是否可以通過與其他組的合併來內部解決。今天的AI,基本上沒有能力在缺乏數據的情況下,創造出如天外飛來一筆的新的選項。

  • 第四級,智慧(Wisdom)。智慧往往是由豐富閱歷、深邃思考積澱而來的洞察——所以我們經常說某位長者智慧深廣、堪為導師。所有的智能都不是用選項的形式來表述的,就像火種,它能在特定的時刻引燃人們思想的火花,照映前路。哪怕再過很久很久,機器也不大可能產生真正的智慧。

大家覺得現在我們說的「人工智能」站在第幾層台階上呢?截至目前,全世界最「聰明」的機器也只是站在了第二級台階上——AI這個概念的大部分含義其實是「功能」,還有一定的「智能」。「智能」與「智力」只差一個字,但對機器而言卻好像是鴻溝天塹,極難攀越——至於讓機器具備「智慧」,劇作家和導演當然會繼續開發此類題材的科幻電影,但科學家們所得到的進展卻微乎其微。

洪小文博士認為,機器進化至今,已堪稱無人能匹敵的「最強左腦」,可是機器也有着明顯的極限和天花板,那便是它們從未發展出右腦能力——至少截至目前,沒有任何跡象顯示,機器能以某種形式像人類右腦那樣進行創新和創造。

洪小文博士認為人腦認知后通常會舉一反三,擁有無窮的創造力。圖像識別、語音識別也是一樣。機器能分辨貓和狗,能根據用戶語音指令查詢天氣、訂購外賣,但這並不代表機器真真擁有智能了。

總之,人類發明的計算機可以成為最好的左腦,而人類自身則繼續保有最好的右腦。機器沒可能也沒必要取代人類,因此,HI+AI(人類智能+人工智能)、創新算法+計算才是潛力無限的組合才是人工智能走向更強之路的最佳途徑。就是「共進化」 Co-Evolution

接下來,洪小文博士用一個視頻跟大家解釋了中文房間概念,中文房間(英語:Chinese room),是由約翰·希爾勒提出的一個思想實驗,藉以反駁強人工智能的觀點。根據強人工智能的觀點,只要計算機擁有了適當的程序,理論上就可以說計算機擁有它的認知狀態並且可以像人一樣地進行理解活動。

一個對漢語一竅不通,只說英語的人關在一間只有一個入口的封閉房間中。房間里有一本用英文寫成的手冊,指示該如何處理收到的漢語訊息及如何以漢語相應地回復。房外的人不斷向房間內遞進用中文寫成的問題。房內的人便按照手冊的說明,查找到合適的指示,將相應的中文字符組合成對問題的解答,並將答案遞出房間。

約翰·希爾勒認為,儘管房裡的人可以以假亂真,讓房外的人以為他確確實實說漢語,他卻壓根不懂漢語。在上述過程中,房外人的角色相當於程序員,房中人相當於計算機,而手冊則相當於計算機程序:每當房外人給出一個輸入,房內的人便依照手冊給出一個答覆(輸出)。而正如房中人不可能通過手冊理解中文一樣,計算機也不可能通過程序來獲得理解力。既然計算機沒有理解能力,所謂「計算機於是便有智能」更無從談起了。

(文中房間視頻地址 http://v.qq.com/x/page/x0340dupqyj.html)

那麼,大腦(Brain)、心靈(Mind)、意識(Consciousness)是一回事嗎?「我」這個詞來自於心靈對自身的一種定位和認同,心靈決定了「我」是什麼樣的人,為什麼和別人不一樣。而意識則像是時刻都在流動的具有工具性質的運算程序。

紐約州立大學的心理學家小戈登·蓋洛普(Gordon Gallup Jr.)主持的「鏡子測試」表明,猩猩、大象和海豚似乎能認出鏡中映像是自己,這說明,這些動物已聰明到具有自我意識,那它們也有心靈嗎?也有「我」的定義嗎?可以說,現在的人工智能還完全處於弱人工智能的階段。洪小文指出,現在還有很多AI無法做到、但是對於人來說是再平常不過的事情,比如自我意識、創造力等等。

因此比較好的對待AI的態度應該是人和機器各取所長,相得益彰,實現共同發展。"Human + Machine = Superman": 讓計算機在大數據上運行人類發明的算法!


我們正在走向「奇點」了嗎?小文博士認為我們現在的擔心還為時尚早。P=NP嗎?

需要快速思考來解決的問題就交給計算機吧,把人腦解放出來去解決那些需要深思熟慮的問題!


想在手機閱讀更多電腦與科技資訊?下載【香港矽谷】Android應用
分享到Facebook
技術平台: Nasthon Systems