清華教授鄧志東談AI金融:算法已經成熟,垂直應用關鍵在於大數據

..

「人工智能產業發展有四個維度:場景、大數據、計算能力與算法。大數據是基礎,計算能力是前提,算法靠人才,場景的選擇最為重要。從商業化角度來說,人工智能金融就是大數據金融。因為應用中的基礎算法都是相對成熟的深度學習算法,可以通過招聘人才來進行調優,計算能力可以全球購買;在場景已經細分確定的前提下,承載行業頂級專家知識的帶標籤的大數據就顯得尤為重要。」

近日在上海舉辦的金融科技峰會上,清華大學計算機系教授、博士生導師鄧志東在「人工智能:智能金融與黃金時代」演講中表述了上述觀點。對於外界來說,鄧志東教授更為人熟知的成就可能來自自動駕駛領域——自2009年起帶領團隊開發了三輛具有感知和自主決策功能的自動駕駛汽車。而事實上,據雷鋒網了解,在人工智能與金融結合領域,鄧教授也頗有心得,他笑稱「關於智能金融,我已經講過六七次了。」

鄧教授認為,時代的進步造就了A(人工智能)B(大數據)C(雲計算),而大數據、大計算與深度卷積神經網絡結合起來,成就了人工智能的偉大復興。

他表示,作為一種感知智能,深度卷積神經網絡能最好地模擬生物視覺通路,在完備大數據與超強計算硬件的強力支撐下,通過多級多層特徵的自動提取,已在計算機視覺、語音識別、自然語言處理、自動駕駛、大數據分析等諸多方面,接近、達到乃至超過人類水平。

此外,以AlphaGO為代表的深度強化學習,已具有超人類水平的博弈類決策能力。未來需要探索和突破的主要研究方向,包括「特徵提取+認知推理」的小數據深度學習方法,可解釋的深度學習方法,具有語義理解的深度學習方法以及具有多任務學習能力的通用人工智能等。

中國人工智能發展的優勢與短板

隨着AlphaGo的橫空出世,人工智能商業化落地的速度不斷加快。鄧教授認為,在未來5到10年時間內,包括深度卷積神經網絡和深度強化學習在內的深度學習算法,將會逐漸釋放出真正的商業價值,賦能產品、企業與社會。比如,基於大數據人工智能,LFW人臉識別率已提升到人類水平的97.6%,現在最新的人臉識別準確率已經達到99.8%,可以應用到銀行開戶、支付、取款等各種場景。此外,人工智能在醫療、零售、會計、審計、製造業、物流、翻譯等行業都大有可為,可提高效率,降低成本,因此也有不少職業面臨被機器取代的風險。

在中國,鄧教授指出,人工智能發展存在幾大優勢。一,應用場景規模大,且商業落地很快。二是中國「互聯網+」發展迅猛,擁有更多的海量大數據。「大數據被稱作是人工智能新時代的原油,從這點來看,銀行本身還坐擁數據金山。」三是政府支持力度大。

而同時,我們也需要正視發展短板,主要體現在四方面:

  • 一是中國原始創新能力不足,關鍵性基礎算法和高端芯片缺乏;

  • 二是AI高端人才比較稀缺;

  • 三是投資界過於追求短線逐利,國外的AI收購幾乎都是十億美元起步,對技術與產業趨勢的把握敏銳超前;

  • 四是體制機制障礙,國有巨頭型企業對AI的前瞻性布局不多,投入少,大部分仍在觀望之中。鄧教授類比互聯網時代巨頭或初創企業對於互聯網經濟所持的各種態度:「有不屑一顧的,有觀望的,有冷漠『理性』的,有嘲諷的,當然也有全情投入的」,「全情投入成就了BAT。相信再過三五年,一定也會有全情投入的人工智能巨頭出現。」 

算法已經成熟,垂直應用關鍵在於大數據

具體論及人工智能對金融的影響,鄧教授表示,「互聯網金融正在向人工智能金融發展,因為現在互聯網金融網上消費的用戶體驗其實不算好,都是些下拉菜單,線下門店的人工服務相比更加自然親切。下一步可以利用人工智能,改善線上的用戶體驗。此外,深度學習也會改變金融服務的產品形態與流程。」

"人工智能產業發展有四個維度:場景、大數據、計算能力與算法。大數據是基礎,計算能力是前提,算法靠人才,垂直應用領域要細分,要細分到具體的問題上。」鄧教授告訴雷鋒網。

「從商業化角度來說,人工智能金融某種意義上就是大數據金融。因為應用中的基礎算法都是相對成熟的深度學習算法,可以通過招聘人才來進行調優,計算能力可以全球購買;在場景已經細分確定的前提下,大數據就顯得非常重要。而這部分需要行業頂級專家的深度參與,通過大數據的清洗、標籤,實際把行業頂級專家的知識轉移給機器,從而讓人工智能站在巨人的肩膀之上。」

他指出,金融大數據大多是結構化或半結構化的表單數據,數據質量高,並且已較早實現了大規模數字化、網絡化採集與存儲,具有相對較多的大數據歷史積累,這一點與其他行業不同。

但值得注意的是,交易數據雖然很多,但是帶標籤的很少,所以「在大數據沒有標籤之前,還談不上人工智能,一般是在利用數據挖掘等傳統方法來做大數據分析。」

數據貨幣化的戰爭

數據貨幣化會成為顛覆金融業未來的八大驅動力量之一,數據流的價值將顯著提高,世界經濟論壇(WEF)今年8月發佈的一份名為「金融服務顛覆式創新」的報告指出。「多種數據源的動態、靜態數據集將會愈加豐富,擁有和控制數據將成為所有利益相關者的關鍵能力。」

但獲取這種關鍵能力是一場場艱苦的戰鬥。

譬如,保險行業正在受到保險科技的崛起和客戶基礎結構轉型的挑戰,聯網設備不斷增加,但是消費者並非主動自願提供個人信息,這說明保險公司未能讓客戶相信聯網保險服務符合他們的利益。

在借貸領域,新的數據來源和分析使用方法得以覆蓋銀行客群之外的長尾客戶。但對於傳統金融機構來說,首先面臨著非金融機構的競爭威脅,國內有阿里借唄、京東白條,國外有亞馬遜商家信貸;再者獲取的弱金融屬性數據在改進成熟客戶的承銷方面的效果有限,此外這些數據通常是非結構化和孤立的,在投入使用之前,還需要轉換大量投資數據,自動化和新的分析手段。

論及借貸的關鍵環節——風控,據雷鋒網觀察,金融科技公司常宣稱自己是「人工智能風控」,而銀行對外多提及「大數據風控」,並表示在數年前就已經開始應用類似手段,只是那時還沒有出現」大數據「這個定義。

鄧教授的觀點或許從一個側面解釋了這個現象,「這裡的所謂大數據風控可能並沒有使用標籤數據,即沒有閉環利用基於標籤的深度監督學習及由此獲得的行業頂級專家的知識。」因此,他肯定道,人工智能風控勢必更優於大數據風控,「此外,人工智能的研究範疇不僅限於此類,還有小數據深度學習、認知智能、通用人工智能等。」

最後,鄧教授表示,目前人工智能的革命性進展源於深度學習或因與深度學習的結合。人工智能的金融產品開發與產業發展正處於爆發期。僅需利用人類視聽覺功能和簡單決策能力的規範性或工具性的金融職業與崗位,有可能被人工智能所逐步取代。從「互聯網+」到「人工智能+」,ABC大數據智能革命將會深刻地改變我們這個時代。


想在手機閱讀更多網絡與創業資訊?下載【香港矽谷】Android應用
分享到Facebook
技術平台: Nasthon Systems