CNCC 2018 次日,吳軍、張建鋒、馬維英、凌曉峰等暢談大數據與數字經濟

..

雷鋒網 AI 科技評論按,2018 中國計算機大會(CNCC2018)於 10 月 25-27 日在杭州國際博覽中心舉辦,會議由中國計算機學會(CCF)主辦,杭州市蕭山區人民政府、浙江大學承辦,浙江工業大學、浙江工商大學、杭州電子科技大學協辦。今年的大會主題是「大數據推動數字經濟(Big Data Drives the Digital Economy)」,CNCC 邀請到近 400 位國內外計算機領域知名專家、企業家到會演講,會議包括 15 個特邀報告、3 個大會論壇,60 個技術論壇,20 場特色活動。

今天是大會次日,特邀報告環節由 CNCC 2018 論壇委員會主席、北京理工大學教授王國仁主持。

作為首位上場的特邀講者,新加坡國立大學教授黃銘鈞為我們帶來了題為「企業級區塊鏈系統:從 0 到 1,再到無窮」的報告。

他主要從區塊鏈的概念、技術和價值三個方面來進行分享,並為企業級區塊鏈系統提出了改進和優化方案。他認為區塊鏈有四個關鍵的概念:分佈式共享賬本、加密、共識以及智能合約,涉及的技術包括數據結構金額共識機制。

區塊鏈的作用既體現在可使用去中心化的系統提供「中心化」數據存儲服務、更為友好地支持數據監管與溯源,也體現在能增強數據的透明性,並以此構建互不信任節點間的信任機制,其價值具體表現在六個方面:

第一,通過更為直接的交易,降低運維成本;

第二,達到高度的透明和共識,共享可信的交易;

第三,降低錯誤率;

第四,可實現彈性擴容;

第五,不可篡改的加密機制可保證安全性;

第六,嚴密的交易審核。

然而,隨着大量出於投機主義的 ICO 活動以及過度吹捧的區塊鏈系統的出現,使得區塊鏈技術非常容易淪為盲從者的「毒藥」。他認為區塊鏈技術不是僅僅用來造幣的技術,結合行業的去中心化的應用才是王道。

對於能夠運用到行業中的企業級區塊鏈,他認為應該具備高吞吐、易用、安全與隱私、鏈上可擴展性四個特點。他指出,現在比特幣、以太坊、超級賬本的交易速度分別達到每秒 6 筆、每秒 10 筆、每秒 600-1000 筆,某些系統更是聲稱能達到每秒 3 萬筆(甚至更高),然而目前尚未有可靠的第三方測評予以實證,區塊鏈技術距離成熟還有一段較長的路要走。

針對當前區塊鏈本身以及在行業應用中存在的問題,他從提升性能、增強功能以及友好交互三個方面提出了改進和優化方案:第一,要從包括可擴展性的提升、優化共識模型、加速運行引擎、實現更強的存儲系統幾個層面來提升性能;第二,通過實現易用的智能合約語言以及易於表達邏輯上的約束檢查來增強區塊鏈功能;第三,通過採用聲明式編程語言來實現友好交互。

新加坡國立大學教授黃銘鈞

第二位特邀講者是 Google 中日韓文搜索算法的主要設計者吳軍,他的報告題目是《超級智能時代》。

吳軍博士認為未來的世界應該是強連接的,而這種強連接帶來的好處包括:更好地保障食品和藥品安全以及交易安全,還能夠更好地追蹤健康,讓人能夠更加及時發現病症。同時,他也指出這種強連接會帶來隱私隱患、風險和危害,例如,IT 巨頭掌握並控制大量的數據信息,一旦泄露就會導致巨大的隱私風險;黑客犯罪成本接近零,巨大的收益將會鼓勵他們進行網絡犯罪。這些問題可能是用法律無法解決的,所以我們需要嘗試從技術的角度來解決它們。

他表示,區塊鏈是可能的解決方案。這是由於其具備如下特點:

一是這項技術將所有權、使用權和驗證分開了,更好地保證了公正性;

二是較高的安全性,其理論上是無法破解的;

三是方便性,可隨意合併打包和拆解,能很好地進行追蹤,極大方便了溯源;

四是低成本;

五是透明化程度高。

至於區塊鏈在具體應用場景中的作用,他提到兩點:第一,去中心化,能夠存放病例等數據信息,使得使用者和擁有者都能從中獲益;第二,是智能合約方面的應用,能夠使用區塊鏈監控貸款還款以及撥款等問題,所有的執行完全由算法監控,這使得相關人員都無法進行人為違約。

在列舉了區塊鏈的種種優勢和作用后,吳軍博士也承認,區塊鏈的這些優勢有一定的理想化成分。在現實情況中,區塊鏈的協議還很粗糙,使用不夠方便,並且成本非常高,比如使用區塊鏈買一杯星巴克需要花費 12-15 美元,並且還會存在 2-3 個小時的延時問題。

最後,他總結到:雖然區塊鏈現在還存在很多問題,現存的 99% 的區塊鏈甚至是假的,不過區塊鏈也確實能解決現在一些難以解決的問題。有些問題倒過來看就是一個機會,當出現問題的時候,就是每個計算機科學家得到機會的時候。

Google 中日韓文搜索算法主要設計者、博士吳軍

第三位報告嘉賓是加拿大西安大略大學終身教授、加拿大工程院院士凌曉峰。他開場幽默地表示,自己來自於西安大略大學,而不是西安大學。他說道,今天會場有很多博導、研究生,而在報告之前,他想先向大家推薦他和楊強教授的書《學術研究——你的成功之道》。他表示,這是推薦,不是推銷,國內很多網站上都可以找到這本書的盜版資源,這引得現場歡笑連連。

談到人工智能,他表示,人工智能更多解決的是實際問題,但做研究的人太注意算法,不注意實際問題。我們應當「先找到釘子,再找適當的鎚子去錘它。」

說到人類智慧,他提到《人類簡史》。其中有三次重要革命,一是認知革命,二是農業革命,三是科學革命。在他看來,侵略性(aggression)和智慧(intelligence)是兩個驅動力。將侵略性和智慧分為兩維,有人只擁有後者沒有前者,有人只擁有前者沒有後者。在他看來,普京就是集合兩者的代表,特朗普在這兩點上都略微比普京差一點。

報告最後,他提到人工智能發展的七大趨勢:

  • 智能大腦,它從人工智能出現以來就在不斷發展。

  • 智能大腦+,未來將會是「AI of Everything」。

  • 智能機械人,比如家庭服務機械人,這在嚴重老齡化的社會極有發展前景。

  • 無人駕駛,這會給經濟、人類社會發展帶來極大變革,不過這項技術目前還有諸多挑戰,比如 Uber 在今年三月發生了一場事故。

  • 人工智能將來會擁有情感。

  • 智能伴侶。

  • 智能機械人/戰爭。

他表示,五年、十年後將出現更高的失業率,但生產率將會更高。這裡提出四個 C:一是 Critical,要有批判精神;二是 Creative,要有創新思維;三是 Communication,會交流;四是 Collaboration,即合作。

中國特彆強調填鴨式教育,現在大學生都應該學習編程程序,比如 Python 或者 AI 程序,他也極力為大家推薦了《Hands-on machine learning with scikit-learn&TensorFlow》一書。他表示,教育不應太注重死知識。

而在報告中,他也提到他們在歐洲做的服務於糖尿病人的平台 GoHealthNow,接下來他們也打算在中國做一個閉門式系統。

加拿大西安大略大學終身教授、加拿大工程院院士凌曉峰

隨後上台的嘉賓是位元組跳動副總裁、人工智能實驗室主任馬維英,他的報告主題是《人工智能賦能全球創作與交流平台》。他表示,在凌曉峰教授之後進行報告的壓力非常大,因為凌教授講得太風趣了。

報告伊始,他簡單回顧了人類歷史在不同階段技術的變革,從造紙、印刷術再到 PC 互聯網時代,進一步是智能手機、移動互聯網時代,再到智能手機+移動互聯網時代,再到人工智能時代,未來是人工智能與人類共同學習的超級智能時代。

接下來,內容分發將會變得智能化、個性化、社交化,以及無處不在。

他說道,人工智能基礎設施、平台與服務將會賦能推薦、搜索、助理、社交。現在大家在手機上就能進行短視頻創作,在過去一段時間,短視頻在全球範圍內快速增長。他們希望利用人工智能技術,理解每個視頻里的情感、情緒。

隨後,他舉了 AI 輔助內容創作的幾個例子,比如人體關鍵點檢測與跟蹤技術及應用。另外,他也提到特效和手勢識別技術及應用,如瘦腿、控雨等特效,此外也有一些與電商有關的場景。

在機器寫作領域,他舉了如下例子,系統可以在體育運動中偵測球員在場上的位置,知道他們在球場上的活動,看球員是否進球,目前可以完成葡萄牙語、英語、日語等多種語言的自動寫稿。

對於人工智能輔助內容審核,他表示這裡涉及到圖像識別模型、文字識別模型以及虛擬識別模型。除此之外,音樂創作也包括多種應用場景、解決方案、技術平台。希望讓 AI 回到源頭,輔助人類消費和生產。

位元組跳動副總裁、人工智能實驗室主任馬維英

第五位嘉賓是阿里巴巴集團首席技術官、阿里巴巴達摩院院長張建鋒,他基於阿里巴巴集團核心技術布局及階段性成果,多角度地展示了新技術對新零售、智能生活等數字經濟的支撐作用。

他首先從數據的獲取、存儲、處理和應用四個數據化角度,詮釋阿里巴巴如何建立端到端的數字經濟框架。

目前阿里巴巴已累積了海量的數據來支撐其數字經濟體,例如,基於現有業務,阿里巴巴積累的數據總量超過 1500 PB,每日數據的更新量達 100 PB,數據處理能力為每日 300 PB。

數據中心作為承載海量數據的基礎設施,阿里目前已在全球建立了 200 多個數據中心,並對服務器進行定製化來加強數據的可控性。此外,阿里巴巴還採用全域智能數據庫與存儲系統來支撐數據存儲和分析,並將軟件的操作固化到硬件上去,採用雲端一體的人工智能芯片來支撐海量數據的計算。

他還從阿里致力於實現的應用場景出發,展示了數據技術創新對數字經濟的推動作用。例如在新零售領域,阿里通過超大規模圖計算技術挖掘數據深層次關聯的價值,使得線上購物等行為能獲得與線下一致的體驗。作為北京冬奧會的合作夥伴,阿里還在致力於將冬奧會場館 3D 化,並嘗試將室內 3D 化擴展到城市級別的重建,建設數字化城市。在跨境電商方面,數據則能提供多語言服務能力,而這種語言服務能力會深刻地影響業務的形態。此外,數據在智能生活、城市大腦和工業大腦等應用中,分別發揮着提升語音交互體驗、作為城市新型基礎設施、為企業利潤的持續增長提供新路徑等作用。

最後,他也對技術在學術界和工業界的差異性,表達了自己的看法。他表示,在學術界可行的技術,在應用於工業界時,即便實現了 99.99% 的準確率,那 0.01% 的失誤率也意味着事故隱患,因此,技術在工業界還有很長的路要走。

阿里巴巴集團首席技術官、阿里巴巴達摩院院長張建鋒

短暫的茶歇之後,迎來今天上台的第六位嘉賓——中科院計算所高通量計算機研究中心主任、中科睿芯董事范東睿,他的報告主題為《高通量數據流眾核處理器》。

報告伊始,范東睿博士借用了個性定律——「每一個比特都在互聯網上,每一個比特幣都可以在互聯網上流動,比特所代表的每個對象都是在互聯網上可計算的」來詮釋高通量的特質:交互流動並可被計算。

他說道,我們現在都不需要說數據大了,我們要關注的是怎樣去處理這些大數據。對此,他的觀點是,未來的數據世界,高通量數據處理將佔據最高點。

范東睿博士主要從中科睿芯三代處理器的發展歷程來詮釋高通量技術的特點和計算優勢。

  • 第一代為 2006 -2011 年的高性能數據流眾核處理器,其利用了基於數據流的運行時管理的關鍵技術,可支持線程的高效啟動和退出,以及細粒度同步操作方式;

  • 第二代則是 2011 年-2017 年的高通量數據流眾核處理器,這代處理器融合了時間敏感的高通量數據通路,可實現離散訪存收集,提高訪存帶寬利用率,並支持時間敏感任務調度機制,確保網絡通信服務質量;

  • 第三代處理器則始於 2018 年,范東睿博士將其稱作「激進的高通量數據流眾核處理器器」,其採用高通量「時敏數據流」(時間敏感控制+數據流執行)硬件結構,能極大地提高能效性。

基於這三代高通量處理器,范東睿博士對高通量前沿使能技術的展望是:超導+光互聯。他認為二者結合將是高通量計算的完美數據流方案。

中科院計算所高通量中心主任、中科睿芯董事長范東睿

接下來上台的嘉賓是英偉達公司高性能計算與新興業務中國區總經理劉通,他在報告中表示,TURING 架構是英偉達巨大的跨越,這裡他用具體參數給出了說明。目前,英偉達也在持續探索新的領域,雖然深度學習在今天依然處於萌芽狀態,但英偉達為這一切提供了可能。他表示,英偉達芯片存在非常多的探索性、可應用性。隨後,他列出了幾個通用深度學習加速器,如 Tesla T4,TensorRT 5.0。

談到此次大會主題「大數據推動數字經濟」,他表示,我們需要持續探索新的領域。隨後,他指出數據科學面臨的巨大難題:如在數據的提取、分析,以及訓練過程中,等待數據結果非常耗時。面對現在的瓶頸,必須在性能上實現飛躍。

他提到英偉達發佈的軟件加速產品 RAPIDS,目前已經開源,支持 CUDF、CUML、CUGRAPH 等,可以實現用更快的速度來解決實際問題。他着重介紹了英偉達新產品 DGX-2,他表示,一台 DGX-2 可以替換 300 台普通服務器,這在性價比上極有優勢。

報告最後,他提到英偉達深度學習學院,既支持實戰培訓,雲端配置 GPU 實驗環境,還可以進行系統化培訓,以提升解決行業實際問題的能力。而在下個月中旬,英偉達將在蘇州舉辦 GTC CHINA2018 大會,會上將有更多關於英偉達技術的分享。

英偉達公司高性能計算與新興業務中國區總經理劉通

隨後是兩位 CCF 青年「兩秀講者」的主題報告。

上海交通大學陳海波教授的報告主題是《低時延數據中心操作系統》。報告伊始,他表示,現在很多高頻交易都是在與時間賽跑,在傳統領域,時延是制約用戶體驗的關鍵因素,現在網絡計算應用時延需求從秒級走向微秒級。任天堂總裁岩田聰曾提到,電子娛樂交互體驗中最重要的是用戶能夠得到快速響應,目前雲計算還難以滿足遊戲平台的低時延需求。

隨後他提到以下兩點:典型應用時延需求中,網絡時延和系統時延都是關鍵因素。隨着 5G 等超低時延網絡的出現,數據中心時延更為關鍵。

他表示,1967 年首屆 SOSP 在田納西州舉辦,同年多道程序設計提出者 Maurice Wilkes 獲得圖靈獎,2017 年第 26 屆 SOSP 在上海舉辦,同年第一個瀏覽器實現者 Tim Berners-Lee 獲得圖靈獎。

隨後,他表示操作系統演化進程從以前的單機 OS 進化到現在面向網絡的操作系統,而為了構建低時延數據中心操作系統,主要有如下幾點挑戰:

  • 挑戰一:低效抽象。數據中心硬件走向納秒級時延,低效抽象掩蓋硬件低時延能力。

  • 挑戰二:協作失衡。如單節點突發高時延以較高概率增加整體時延。

為了應對這些挑戰,需要進行計算範式的演化,平衡計算和數據的遷移。

接下來他引出原位計算的概念,原位計算即面向低時延硬件時代的計算範式。而這裡也有如下三點挑戰,一是如何提供硬件資源的低時延抽象,二是如何平衡劃分數據減少數據遷移,三是如何基於高效數據遷移構建計算框架。

報告最後,他總結了他們團隊近期的工作,包括低時延硬件抽象、高質量數據劃分、原位計算範式框架。從近五年操作系統領域論文統計情況來看,他們的團隊的表現相當不錯。

2018 CCF 青年「兩秀講者」、上海交通大學教授陳海波

最後一位特邀講者是 2018 CCF 青年「兩秀講者」、中科院計算所研究員孫曉明,他的報告主題是《量子計算》,主要分享了其在量子計算方面的研究進展。

他從量子計算的發展歷史、特點以及經典算法幾個角度,為大家進行了分享。量子計算由理乍得·費曼於 1982 年提出,主要通過兩大特性——量子疊加和量子糾纏來加速計算,量子計算運行在一個圖靈機上的計算能力基本就相當於經典圖靈機。同時,孫曉明研究員還分享了兩個經典的量子算法——Shor 算法和 Grover 量子搜索算法。

此外,他還重點講了最近非常熱的一個概念——「量子霸權」。這一概念最早由加州理工學院量子理論學家 John Preskill 提出,目前有很多企業對這個學術概念進行研究以尋求突破,不過也有另一部分企業選擇其他的研究方向來加速計算。

最後,他講了自己對量子計算的理解:應該儘可能地去理解量子計算的能力和局限。量子計算雖然讓很多難題的解決成為了可能,但它也有不能解決的問題,不過正是這些不能解決的問題,給了量子計算更多發展的可能性。「試想一下,量子計算在未來有可能應用到機器學習和深度學習中嗎?」

2018 CCF 青年「兩秀講者」、中科院計算所研究員孫曉明(左)

精彩的特邀報告就此結束,上午與特邀報告同期舉辦的 CCSP 2018 頒獎會也引起了較大關注,雷鋒網 AI 科技評論獲悉,清華大學、華中科技大學、長沙理工大學成為排名前三的高校。下午則迎來多場精彩的技術論壇,如「數據開拓商業新業態」、「自然語言生成:讓機器掌握文字創作的本領」,「神經科學理論與新計算模式交叉論壇」等。技術論壇結束之後,將會迎來今天的重磅環節——CCF 頒獎晚宴,屆時,將會揭曉一系列獎項。雷鋒網 AI 科技評論也將持續為大家帶來更多關於會議的現場報導,敬請關注。


想在手機閱讀更多電腦與科技資訊?下載【香港矽谷】Android應用
分享到Facebook
技術平台: Nasthon Systems