通聯數據首席科學家蔣龍:人工智能、大數據助力科學投資

..

雷鋒網AI金融評論按:2018全球人工智能與機械人峰會(CCF-GAIR)在深圳召開,峰會由中國計算機學會(CCF)主辦,雷鋒網、香港中文大學(深圳)承辦,得到了深圳市政府的大力指導,是國內人工智能和機械人學術界、工業界及投資界三大領域的頂級交流盛會,旨在打造國內人工智能領域最具實力的跨界交流合作平台。

6月30日下午,在金融科技專場上,通聯數據首席科學家蔣龍分享了題為《人工智能和大數據助力科學投資》演講。

以下是演講原文,雷鋒網作了不改變原意的編輯:

加速發展的大數據時代

今天的主題是金融科技,金融科技是非常廣的領域,有信貸、支付、證券、保險等,我要談的是金融的子領域,就是資產管理領域。

資產管理,簡單說就是如何更好地配置人類所積累下來的財富,使得社會能夠更快進步,能為人類產生更多價值。我們怎麼用最好的手段管理財富,比如說把這些錢應該投向什麼行業,投向什麼技術,讓誰來引導這些錢,讓財富更快增長,這是一個巨大的挑戰,在這個挑戰背後,我們看到人工智能和大數據可以給我們帶來很大的助力。

說到投資大家可能會立馬想到股票、基金,有些人想到風險投資,有的人可能會想到投資大宗商品,有的人可能想到做一些收藏品,這些都是投資,投資的種類很多,但是投資的核心是預測,基於拿到的各種數據去挖掘規律,根據規律對未來做出判斷,判斷可能是這個人未來可能會成就一番大事業,所以投資他的初創企業,或者你預測到了人們的消費趨勢在變化,你看到變化能夠知道某些行業未來會受益,你把資源投資這些行業,這些都是基於預測的投資。

所以信息通訊和計算技術對於投資領域的影響一直以來非常巨大,70年代開始誕生指數基金,由人管理錢變成計算機自動管理錢。截至2017年,在北美市場上,指數和量化基金的規模第一次超過了人主動管理的規模,已經成為主流。隨着互聯網帶來的數據量的變化,隨着計算機在數據分析上的能力的提升,漸漸的我們有辦法去對資產的收益和風險進行一些分析預測,所以我們可以做一些量化對沖,把我們知道的信息變現,對沖所有風險。隨着大數據人工智能的發展,現在有更多的投資科技的名詞誕生,比如說智能投顧、智能投研等等。

當今投資科技的要素有三個——專業投資理解、大數據和人工智能。為什麼第一個是專業投資理解?幾年前美國有一個博士生做過一個實驗,他分析了世界上各種各樣的數據,後來他發現孟加拉的黃油價格跟標普的走勢非常想象,他用過去十年的數據證明了這兩個基本上可以完全的擬合,但是這只是偶然擬合,你不可能拿孟加拉的黃油價格去預測接下來標普500的走勢。因為世界上的數據實在太多了,任何一個數據都可能發現偶然相似的事情,在機器學習領域我們經常說過擬合,怎麼控制過擬合?如果有足夠多的數據,可以通過數據自動解決,但是沒有的情況下,我們需要有先驗支持,有了投資科技,我們開始把投資變成一種科學化,大家都知道投資大師巴菲特有投資藝術,藝術的東西只會意會不可言傳,無法把投資邏輯複製出來,沒辦法去得到同樣的投資結果,也沒有辦法去歷史上去做實驗,投資好在哪裡,弱點在哪裡,這就不是科學。有了大數據,人工智能、量化科技,我們有可能把投資作為科學,可以重複實驗分析投資裡面的策略問題,能夠更有效的提升。

投資科技場景

人工智能和大數據在投資裡面的應用非常廣泛,我這裡列舉了幾個比較重要的場景。

第一個叫投資研究,投資研究的目的是把信息進行加工,從裡面得出投資決策,現在是信息爆炸的時代,如何挖掘信息,人腦已經漸漸發覺很有挑戰,需要AI幫我們,這裡還有非結構化的數據處理,像圖象信息、自然語言文本信息、音頻數據等等,有了這些信息之後,我們如何發掘規律,人腦可以處理一些變量不太複雜的,如果一百個一千個變量的話,人腦基本無能為力,這時候如何通過AI來幫我們完成在海量變量下的投資預測。在得到投資決策之後,我們需要通過交易來實現決策,如何更低成本的去進行交易,每天有很多人在股票市場交易,你怎麼保證最低成本,對市場是造成最小衝擊的,這裡基於博弈論的機器學習的方法正在實現價值,包括風控,投資的時候如何控制風險。另外是投資服務,也是新的領域,有了投資能力之後,最終是要為人類服務的,不管是為個人還是企業,怎麼樣讓我們的服務變得更高效,智能投顧是一個非常大的創新。

我們生處在一個加速發展的大數據時代,每隔幾年數據就要十倍的增長,並且指數提升。大數據背後我們知道有數據採集能力,像智能硬件這方面的進步,也有計算機處理的能力進步,更多的是場景,有了這個技術,有了場景,有了閉環,導致數據像滾雪球一樣越來越大,這樣的數據對投資來講可以分成三大類,一種是客觀世界的數據,比如說可以通過衛星來觀察地球發生什麼變化,也可以通過微博去觀測人們表達出來的主觀想法,從主觀世界了解人們的想法,我們也有移動支付,有很多的交易,有些企業裡面的工業生產的資料,讓我們發現一些關係的變化,比如說錢怎麼從一方到另外一方,這三種變化可以讓我們對世界觀察非常細緻徹底,而且非常及時,對投資來說這非常重要。

這裡我們可以看一個例子,如何利用客觀世界的數據幫助我們做宏觀預測。我這裡引用了去年美國國家經濟研究中心的一篇文章,這篇文章的標題很有吸引力,「中國的GDP增速可能被低估了」,大家都知道西方經濟學對中國的增長不是那麼信任,尤其是統計局的數據,但他們有自己的方法研究,他們會利用一些另類數據,比如說燈光數據,大家可以看到圖上右上角的圖片,是美國軍用衛星拍攝的北京和天津地區夜晚燈光情況,利用同樣類似數據,美國這些經濟學家發現在98年亞洲金融危機之後,亞洲各個國家的經濟恢復速度和夜晚燈光變化有關係,通過這種方式來預測中國,發現中國過去幾十年的GDP增長,可能比我們公布出來的還要高,所以我們不是高估,而是低估了自己,他們估計可能是中國缺乏對第三產業準確預估的能力。

右下角是我們的實踐,我們去網站上也下載了中國各個省自治區夜晚燈光的圖片,我們做了分析,發現人均GDP和人均單位面積燈光強度是有非常大的關係,同樣的還有很多的自然信息可以利用,比如說有些公司會分析各個地區空氣污染物的成分和比例,來分析當地的能耗,從能耗裡面反映GDP增長,還有人利用衛星圖片觀察農作物的生產情況,預測接下來GDP的發展情況。除了客觀世界,主觀世界,還有很多東西來預測。

NLP與非結構化數據處理

如果我們要做投資,會面對海量數據,比如一個國內投資者每天會面臨上千篇的上市公司公告、上萬篇的財經和行業的重要信息,還有數以千萬計的投資者和社交媒體發佈的消息,這些肯定是處理不過來的,這時候就要藉助於AI來幫助我們分析。這裡分享一個簡單例子,怎麼樣從上市公司發佈的公告去提取信息,判斷公告是否重要,下面是一篇公司發佈的重大合同公告,用自然語言方式描述了合同簽訂雙方和金額等等,通過自然語言提取的技術,能把這裡的關鍵信息,比如說甲方、乙方、合同金額提取出來,提取之後,根據金額和這個企業過去的情況去判斷這些信息是否重要,再結合關係圖譜去識別這兩個關係是否存在潛在關聯信息等等,這都是我們做結構化處理的重要幫助。


機器學習構建非線性策略

剛才提到量化管理已經超過主動管理,成為最主要的投資策略,傳統量化是線性模型或者說多因子模型,多因子模型是把一個資產的收益分解成很多因子收益的求和,但是現實生活中太多因子,其實並不是線性關係。比如左邊的圖是二次關係,用傳統基於IC的方法或者做多做空的方法,很難找到有效的因子,機器學習發展給了我們這樣的機會,機器學習在對非線性模型的研究上有很多的積累,我們可以利用這樣的知識去發掘信息中的非線性關係,幫助我們預測未來資產的收益。

這是我們利用深度學習做的宏觀預測,我們用了很多的經濟變量,比如衡量供給方面、需求方面,衡量人們信息方面,貨幣方面的指標,結合隱藏層的模型做一個預測,預測目標是市場的主要指數,比如債的指數,大宗商品的指數,股票的指數,基於這樣的指數可以做宏觀的資產配置和套利。

這是對一個公司的預測,利用機器學習數據,可以像研究員一樣去分析公司的業務,去預測分析影響公司核心的指標,最終得出營收的預測。這個圖我們是以航空公司為例,一步一步按照人的邏輯去分析收入和成本情況,最後會發現一些重要指標,比如說客座率是非常影響公司財務數據的,這樣的指標如何預測,其實我們可以用一些方法,利用人均GDP的增長,利用航線數,利用鐵路運輸情況、機場擁堵度等等數據去預測每個航空公司的客座率,再把這些數據綜合起來去預測航空公司未來幾個月甚至幾年財務的情況。

從我們自己做的一些實驗結果來看,在預測主營收入上,機械人分析的準確率比人要做得更好,而且對於不同行業來說,有80%以上的行業都比人做得好,在美國的一些研究得到同樣結論,美國的一些公司也做了對美股研究,發現用機器學習研究的平均誤差是22%,但是人工分析師是30%的誤差。

除了在預測營收,預測關鍵財務數字外,交易上機器學習也能幫助我們很多,像阿爾法狗用的是強化學習技術,面臨的場景和交易是一樣的,都需要在動態博弈的環境里觀察對手的行為,做出自己的判斷。在強化學習之前,大家更多的是用傳統的,用過去交易量的數據來估計未來的交易量,現在可以利用強化學習,利用更細緻的盤口數據來預測,根據研究,這樣比傳統做法降低27-35%的交易成本。

智能投顧

最後想分享一點關於智能投顧,這也是過去非常熱的概念,它的想法很好,世界上有很多人都需要財務顧問,但是人工顧問的成本非常高,所以絕大部分享受不到這樣的服務,當我們有了機械人這樣的智能能力之後,我們有機會把顧問服務成本降得很低,讓金融的好處能夠被更多的人享受到。北美地區的智能投顧更多集中在根據用戶的風險和投資期限來推薦資產配置組合,根據我們的研究,中國人還是不太願意做更長線的投資,這需要教育,中國人很喜歡去股市上交易,散戶非常多,怎麼幫助中國散戶做股票交易,我們就把同樣的能力用在這個領域,我們去分析每個用戶的交易,流水,我們分析他們在什麼地方犯過錯誤,有的是對市場大盤的預測做得不好,導致倉位有很大虧損,我們分析了這樣的問題之後,可以針對性的提供一些幫助,比如可以提供一些智能化的方法,智能化的倉位控制、智能化的止盈止損提醒等等,這樣可以幫助投資者改進弱點。


想在手機閱讀更多電腦與科技資訊?下載【香港矽谷】Android應用
分享到Facebook
技術平台: Nasthon Systems