專訪機器學習祖師爺 Tom Mitchell:帶着理性擁抱機器學習的熱潮 | GMIC 2018

.. 雷鋒網 AI 科技評論按:上個月,全球移動互聯網大會 GMIC 2018 在北京開幕。此次主題為「AI生萬物,諧音愛生萬物,科學技術要有人文的溫度,機器有愛,真芯英雄」的大會上,全球人工智能領袖匯聚全球業界頂尖領袖,探討在基礎硬件、大數據與開源平台、深度學習為代表的算法等人工智能領域的最新洞見,是年度行業發展的風向標。

雷鋒網 AI 科技評論此前就報道了 Facebook 首席 AI 科學家 Yann LeCun 的開場演講《AI 的最新技術趨勢》,也整理了 Yann LeCun、Michael I.Jordan、李開復等人關於 AI 的現狀與未來的圓桌討論

實際上,除了 Michael I.Jordan,還有一位機器學習領域的祖師爺級教授 Tom Mitchell 也來到了 GMIC 2018。會後雷鋒網記者對 Tom Mitchell 教授進行了專訪,教授風度翩翩,語言嚴謹但也非常溫和。

Tom Mitchell,美國卡內基梅隆大學(CMU)計算機科學學院機器學習系主任、教授,美國工程院、藝術與科學院院士,美國科學促進會(AAAS)、國際人工智能協會(AAAI)Fellow,他在機器學習、人工智能、認知神經科學等領域卓有建樹,撰寫了機器學習方面最早的教科書之一《機器學習》,是機器學習領域的著名學者。

雷鋒網 AI 科技評論:現在機器學習非常火熱,我們聽說今年 CMU 計算機系的碩士博士申請大爆發。您覺得機器這個專業現在過熱了嗎?

Tom Mitchell:我覺得學生們很聰明,他們知道機器學習可以在未來的職業道路中發揮很大作用,所以他們有充足的理由選擇學習機器學習。對於職業選擇來說,我了解到要求具備機器學習能力的職位現在有最高的薪水,在美國是這樣,我雖然不清楚中國的情況但我相信也是一樣的。這方面的人才確實有短缺,因為很多公司都認為,有一些在機器學習方面有天分的員工,會對公司的未來起到關鍵作用。

雷鋒網 AI 科技評論:您對申請這個專業的學生有什麼建議嗎?

Tom Mitchell:你可以在編程和統計這兩個方面進行充分的學習。我自己就教授機器學習課程,然後課程結束之後查看學生們的表現的時候,我覺得帶來最大區別的是他們的數學能力。很多學生都知道如何編程,因為這是要求的。實際上,如果你想做機器學習做的比較好,那你需要數學、微積分、線性代數幾門課都學得比較好。所以我現在也對我教的課程做了一些改動,在上課的第一天,學生們可以做一個在線測試,花十分鐘左右的時間做一些簡單的題目,比如如何做矩陣乘法、如何算導數、如何算一個東西的概率,這可以幫助他們自己以及我判斷基礎知識水平。我覺得這就是最好的準備方式。

雷鋒網 AI 科技評論:許多知名教授和研究員都被高薪吸引到了科技企業里。有人認為這會影響未來年輕學者的培養,您同意這種觀點嗎?

Tom Mitchell:這樣的觀點我並不同意。我自己現在就在學校,我也收到了一些 offer 希望我離開學校到企業里去,他們開給我的薪水也確實比在學校當教授的薪水要高得多。但是我拒絕了他們,我喜歡待在學校裡面。但我覺得總的來說,首先,確實有很多學者被吸引到了業界去;這也確實給大學帶來了一些痛苦。不過如果你把眼界放得廣闊一些,看看 AI 的發展,看看 AI 對整個世界的積極影響,我覺得有才能的人到了企業裡面是好事,包括初創公司,他們確實對整個世界造成了影響。那麼大學會因此分崩離析嗎,也不會。而且我覺得,整個人才庫本來就是流動的,我覺得這是其中的關鍵。如果企業來學校招了更多的人,我們也就培養出更多的教授來。

雷鋒網 AI 科技評論:也有人說科技巨頭招走了人以後並沒有做出顯著的研究成果。您同意這樣的觀點嗎?

Tom Mitchell:這個觀點我也不同意。我們很多研究者都用PyTorch或者TensorFlow作為我們深度學習研究的基礎工具。那這些工具是哪裡來的呢?就是這些科技巨頭。那麼如果沒有這些科技巨頭的話,能夠使用深度神經網絡的人也就少了。所以他們也是有積極作用的。這些科技巨頭的問題是,他們沒有足夠的動力分享自己的研究成果。以前所有的好想法都會公開出來,而到了這個時代,很多好想法會深藏在企業裡面。我作為一個學者,對這件事情覺得有點沮喪。不過我也可以接受這個結果,因為我覺得這也代表了 AI 正在走向整個世界。

雷鋒網 AI 科技評論:深度學習是現在最流行的機器學習方法,雖然強大但每個模型都還是只能解決特定的問題。更通用的人工智能有可能通過深度學習實現嗎,還是需要等待新的方法出現? 

Tom Mitchell:我覺得我們現在的深度學習方法有一些明顯的缺點。比如,雖然我們現在在許多自然語言處理問題中使用深度學習方法,這可以算是自然語言處理領域的最新發展了,但是沒有什麼深度學習系統能夠表示出來我現在說的這句話的意思。因為它們都是基於內容的向量表徵的,那我們其實並不清楚一個向量要如何才能表示一個量化的句子。比如我說:「每個畢業了的學生都至少學了三門計算機科學的課程,而且有一位自己的導師。」那麼只要我提取出其中的關係是「對於每一個 x,都有 xxx 的 y」,想要用向量來表示它就會非常難。那麼,着眼未來地看的話,對於深度學習會如何影響自然語言處理,其中一個重要問題就是,我們能否找到一種表示信息的方法,它能夠提取出我說的句子中的微妙信息,但同時還具備向量表示這樣的相似性特點——兩個相近的向量有很大概率表示的是相似的信息。

雷鋒網 AI 科技評論:您如何看待 AutoML?谷歌在研究 AutoML,我們近期採訪過的一家中國公司也在研究 AutoML。他們的目標是希望用 AI 生成 AI,減少深度學習開發中需要的人力,降低使用深度學習的門檻。您覺得這是一個有潛力的方向嗎?

Tom Mitchell:我覺得開發這些能夠自動決定參數、自動決定學習算法的工具是一個很好的方向。不過如果有的公司覺得這樣就可以讓電腦自己完成這些工作,而不用雇一個很懂的人的話,那就很危險了,這會是一個很糟糕的想法。通過一些工具把問題變得簡單永遠是好事,但是現實中想要把機器學習運用在自己的應用中的時候,經常遇到的其實是,「我學這個數據能不能學到我想要的學到的東西」、「我要如何表示輸入數據才能讓它和我選的學習算法兼容」類似這樣的問題。這樣的問題是現在的 AutoML 還解決不了的。

雷鋒網 AI 科技評論:波士頓動力研發的機械人經常給人帶來驚喜,但據我們所知他們使用的還是傳統控制理論。用神經網絡控制的機械人能夠達到那樣的表現嗎?能的話需要多久?

Tom Mitchell:這是一個很棒的問題。我覺得這其中的關鍵問題不是要用神經網絡替換傳統控制方法,而是要把傳統控制方法和深度神經網絡結合到一起。我覺得我們現在就已經可以看到一些結合的趨勢。比如你想想無人機的話,他們就是傳統控制方法和深度學習的很好的結合。今年秋天我教的一門課「深度強化學習」就是關於這個話題的。在我關注的範圍內,傳統控制有一個特點,即便當這個系統要適應一個新環境,那隻要這個系統的設計是正確的,我們就有理論可以保證它的動作可以保持在某一個操作範圍內。比如,你開一架飛機,讓它自動降落,如果它使用是一個傳統控制系統,那麼這樣的傳統控制系統就有理論上的保證,不管降落的時候路是不是凹凸不平,它的動作都能保持在一定的操作範圍內。那麼我們在機器學習以及強化學習裡面缺少的,就是這樣一種理論,如果系統在新的環境裡面要從糟糕的狀況學習達到一個好的狀況,我們沒有什麼理論可以限定它在這兩個狀態之間的過程里會做些什麼。傳統控制理論就在成功做到了這一點,其中部分原因就是這些系統都是較為簡單的系統,所以我們能夠推導出這樣的理論保證。對於把深度神經網絡作為學習機制的系統,它的結果要開放得多,我不是很確定我們能不能得到這樣的理論。不過這在我看來會是一個非常重要的研究領域。

雷鋒網 AI 科技評論:您認為腦科學(神經科學)與人工智能之間是什麼關係?腦科學的知識在您的研究中是否重要?

Tom Mitchell:神經科學對我自己的研究來說很重要。因為我這幾十年的研究里就有接近一半的時間都在做腦成像的實驗來研究大腦是如何工作的。目前來說,很不幸的是,神經科學對人工智能的影響很小,而人工智能反過來對神經科學有很大的影響。我個人在兩個領域都做着研究,因為我相信在未來的發展中兩個學科的互相幫助會比以前更多。我希望我是對的。

雷鋒網 AI 科技評論:前段時間,來自 20 個國家的超過 50 位 AI 學者簽署了一封公開信,抵制韓國科學技術院與軍工企業聯合研發基於人工智能的自主武器。您對人工智能用於武器的態度如何?

Tom Mitchell:我覺得這是人們嘗試讓 AI 做的最危險的事情之一。我覺得,即便他們的公開信裡面點名批評的是韓國,但事實是每個國家都在考慮這個方向。公眾也對此缺少了解,當我看報紙的時候,我感到很驚訝,人們擔心 AI 會侵犯他們的隱私,但他們並不為 AI 可能會成為武器的這件事情所擔心。我覺得這很荒唐,我們似乎關注錯了重點。我們現在能做什麼還很難說。但我覺得我們應該做的,會和我們對待生物武器、化學武器的事情很類似。我們應該把反對武器化AI的國際性條約作為目標,就像我們成功達成了國際條約阻止化學戰爭的出現一樣。我們確實需要做這件事情。所以我為他們的公開信鼓掌,只不過過單獨針對韓國似乎有些不公平,實際上所有國家都有參與。

雷鋒網 AI 科技評論報道


想在手機閱讀更多電腦與科技資訊?下載【香港矽谷】Android應用
分享到Facebook
技術平台: Nasthon Systems