Cambridge Analytica:掩蓋在大數據高科技下的競選作弊器

.. 文/邢逸帆  編輯/光譜

 

美劇《紙牌屋》第四季中,安德伍德總統在第二個任期中遭遇共和黨候選人威廉·康威 (William Conway) 的強勢挑戰。

康威英俊瀟洒、家庭圓滿,出身軍事世家,深得選民喜愛。但真正讓他贏得民心的秘密武器,並非他的個人魅力,而是他和搜索引擎 「Pollyhop」 之間的曖昧關係。在 Pollyhop 的幫助下,康威的競選團隊挖掘選民數據,對他們的日常行為進行分析,清楚地知道了選民們喜歡什麼、想要什麼、想聽什麼,由此進行競選廣告精準投放。康威的正面形象無處不在,每一個政策每一句話都說到選民心坎里,選民主動掏出了選票。

而這幾天現實世界中爆發的大新聞,讓《紙牌屋》的這段劇情變成了一個極具前瞻性的政治寓言。

2016 年美國總統大選期間,就有這樣一家和 Pollyhop 類似的公司。它採用獨家的心理統計模型分析用戶行為,幫助特朗普競選團隊定製從政治立場到競選口號的一切,並精準投放數字廣告,一定程度上扭轉了特朗普的糟糕形象,幫助他贏得了大選。

這家公司來自英國,名叫 Cambridge Analytica。

上述的一切都沒毛病,但問題出在了這家公司獲取數據的方式上。


 

上周五,美國的《紐約時報》和英國的《衛報》兩家權威媒體同時刊文,曝光了 Cambridge Analytica(以下簡稱 CA)違規竊取數據的醜聞。兩家媒體通過 CA 內部信源獲得的證據表明,該公司違反了 Facebook 開放平台協議,獲取了總計超過 5000 萬名 Facebook 用戶(其中大部分為美國真實選民)的數據。

儘管比起泄露了 30 億賬戶資料的雅虎, 5000 萬真的不算多,但考慮到在 CA 事件中用戶的姓名、性別、住址、生活狀態、政治主張、社交關係等信息均被獲取,足夠對一個用戶進行完整畫像,這一事件足以躋身美國史上最大規模數據泄露榜單。

當一家公司擁有了超過 5000 萬個真實個人的數據,和分析這些數據的能力,它的力量足以顛覆一個社會——只要它願意。

過去,全世界只有一家公司擁有這個能力:Facebook。而現在,多了一家公司:CA。

Facebook 沒有這個意願,而 CA 有。

事件曝光后,Facebook 很快開始強行止損,官方宣稱已經在自家的開放平台上關閉了 CA 和 CA 母公司「戰略通訊實驗室」 (Strategic Communications Lab, 以下簡稱 SCL) 兩家公司的接口,並在全平台上封停這兩家機構的賬號。

SCL 官網顯示,這家經營已超過 25 年的公司專門面向「政府和軍事客戶」,向後者提供「數據、分析和策略」等諮詢服務;而其子公司 CA,在 2013 年正式獨立並專門負責競選業務。據該公司 CEO 亞歷山大·尼克斯 (Alexander Nix) 稱,CA 在獨立的第二年就已經參與了多達 44 場美國各級競選。

在美國,CA 主要服務共和党參選人,因其主要股東為共和黨最大獻金來源之一的羅伯特·墨瑟 (Robert Mercer)。2015 年,墨瑟一度支持共和党參議員泰德·克魯茲 (Ted Cruz) 競選總統,於是 CA 開始為克魯茲服務。後來,墨瑟被美國民粹和孤立主義領軍人物史蒂夫·班農 (Steve Bannon) 說服,轉而支持依靠民粹路線嶄露頭角的政壇新人特朗普。次年,CA 加入了特朗普的競選板子,用心理統計模型輔助競選中的大小事宜。

2017 年,班農傳記《惡魔的交易》(Devil』s Bargain) 一書面市,提到班農在近幾年開始崇拜互聯網的力量,並找尋藉由互聯網及數據的力量實現政治抱負的手段。書中對 CA 有了不少描述,也讓這家公司因此得到更廣泛的關注。民調和競選人士普遍認為,CA 為特朗普的勝選提供了非決定性,但仍十分重要的幫助。

班農得到了他想要的,將這家「數據、分析和策略」諮詢公司變成了民粹主義者上位的墊腳石。他一度在 CA 的董事會擁有一個席位。

該公司前核心員工克里斯托佛·懷利 (Christopher Wylie) 在接受《紐約時報》採訪時如此評價 CA 的管理者及服務對象:「他們想要在美國掀起一場文化戰爭,而 CA 是他們的軍火庫。」

CA CEO 亞歷山大·尼克斯。他的公司只用了數年,在政客中的受歡迎程度就超越了有數十年經驗的民調專家

該公司使用心理統計模型幫助競選團隊分析選民偏好並不是什麼秘密。官網明確說明:「我們提供從預測選民行為,到定點推送廣告等一系列服務」,還有更露骨的:「我們會提供數據,幫助用戶取得選票,贏得競選」。


 

CA 能夠如此堂而皇之地說出這樣的話,是因為 「操縱選民」 本身就是美國競選政治的一堂必修課。電視時代之前,競選人都要親自出馬在各個州站台拉票 (stumping) 體恤民情,參選人出席的演講和市政廳會議的熱鬧程度不亞於日本愛豆握手會;到了電視時代,除了繼續到各州演說,選戰也增加了互砸電視廣告一項。投放廣告的目的要麼是穩定自己的支持者,籠絡立場接近的選民,要麼是打擊競選對手——理論上來說,這都是明目張胆地操縱選民。

從 2012 年開始,選戰又增加了選民數據一項。數據一度被認為是選戰制勝的關鍵,靠分析選民數據贏得大選的最出名例子當屬美國前總統巴拉克·奧巴馬。在2008年大選中,他第一次嘗試從數據分析中尋求幫助。奧巴馬的競選團隊在關鍵州每星期進行五千到一萬次短民調,一千次長民調,他們還給每個選民 1)在投票日當天出門投票 2)支持奧巴馬的可能性都分別打了分。2012 年,奧巴馬謀求連任,更是在選民數據這條路上走到了底。而在共和黨那邊,奧巴馬 2008 年的對手麥凱恩,其團隊只進行過一次主動民調。

既然抓取選民信息並進行民意操縱是如此常見的政治手段,那媒體為何要譴責 CA(以及特朗普)呢?

這還要從 CA 掌握的可怕的用戶數據量說起。

在此之前,一直有特朗普靠高級算法獲勝的傳言,但專家認為,這種說法並不靠譜。因為離了數據的支撐,再神奇的統計方法也是空中樓閣,有意義的結論必須通過一定量級的數據才能得出。考慮到現實條件,想要獲得足夠左右大選結果的數據量,幾乎是不可能的。

然而現實往往比電視劇更有戲劇性。如果你接着看 CA 的官網,會發現這樣一段話:「我們對超過兩億三千萬美國選民進行了每人高達五千個數據點的數據採集,通過這些數據,我們可以為用戶篩選出目標群體,接着改變他們的想法,改變他們的行動。」

2.3 億就是一個很可觀,也很可怕的數字了——美國註冊選民數總共也就 2.3 億,2016 年在大選中投票者約 1.3 億。而本次曝出 CA 掌握的用戶信息高達 5000 萬,幾乎是 2016 年總票數的一半。

讀到這裡你可能會疑惑:為什麼坐擁 2.1 億美國用戶的 Facebook 不自己去做競選業務,反而讓 CA 搶走了?

美國法律沒有對本土企業參與本土選舉進行限制,因此 Facebook 可以提供競選廣告。但作為一個流行社交網絡,Facebook 已經成為名副其實的公眾平台,幫助選舉中的一方都意味着作為平台有失公允。所以 Facebook 即使擁有大量選民數據也不會直接參与助選,展示他人投放的廣告是它可以做、也能賺到錢的服務。

但在現實中,Facebook 因在 2016 大選中放出了太多俄羅斯黑客和網絡活動機構投放的廣告,已經飽受詬病,因為美國選舉法律明確說明,海外機構不得插手任何級別的本土選舉。然而英國公司 CA 卻並沒有受到應有的譴責,直到最近違規竊取數據醜聞曝光,追查其干預美國選舉的聲音才熱鬧了起來。

可能人們一直接受了 CA 偽裝的美國身份,抑或是這家在 2014 年就服務了 44 場美國競選的公司,已經從政客那裡得到了庇護。


 

Facebook 發佈的聲明解釋了用戶信息被盜的始末:2014 年,劍橋大學的兩名心理學研究者亞歷山大·科根 (Aleksandr Kogan) 和約瑟夫·錢斯勒 (Joseph Chancellor) 創辦了一家名叫「全球科學研究」 (GSR) 的小公司,並開發了一個心理測試功能的 App,內置了 Facebook 的登錄和開放平台 Facebook Connect ,允許用戶用自己的社交網絡賬號登錄。

GSR 的用戶協議以心理學研究為目的,索要用戶授權,收集用戶信息,其中包括用戶所在地、點贊的內容、打開的鏈接等等,並抓取已授權用戶的好友信息。凡是出現在用戶時間線上的好友點贊和評論,App 都能一併收集。

實際上,科根是 CA 雇來的幌子。他通過 App 提取的 27 萬用戶數據,全部提供給了 CA,而 CA 為他的項目提供了約合 80 萬美元的經費。

2016 年,美國紐約的一位傳播學教授大衛·卡羅爾 (David Carroll) 想要從社交媒體上清理自己的個人信息,做了功課後卻發現自己的信息被一家遠在英國的公司採集了。這家公司正是 CA。

根據英國有關法律,他有權要回自己的信息。在回溯的信息里,卡羅爾卻發現這家公司可能比他妻子還懂他

其提供的報告中寫道,卡羅爾「不太可能支持共和黨」,在「槍支問題關注度」上得三分,在「國家安全問題關注度」上得七分,在「傳統價值和道德操守」上得了九分。這份報告指出卡羅爾最關心的還是美國國債,這一項他得了十分滿分。他在 Twitter 上公布了這份報告,說,「我自己給自己打分也不過如此,可能還沒它打得准。」

這家公司正是 CA。通過 27 萬肉雞提供的數據,CA 構建了一個完全為競選服務的選民心理統計模型。通過這個模型,該公司很快爬取和處理了更多 Facebook 用戶的數據。據《衛報》報道,截至 2015 年中, CA 擁有的 Facebook 用戶數據已經達到「數百萬」。

CA 為卡羅爾製作的報告

在爭取搖擺票時,這種精確的選民分析往往能夠起到決定性的作用。理論上,特朗普競選團隊會向卡羅爾以及和他立場相近的選民推送 「特朗普推行貿易保護政策」、「創造就業機會」、「解決美國中產危機」 等話題的廣告,抑或推送「希拉里身陷郵件門醜聞」、「疑與多名男性有染」的信息。

可想而知,道德情操得分極高、關注國家債務的卡羅爾教授會把票投給誰了。儘管他「不太可能支持共和黨」,這些推送也足夠斷絕他對特朗普的政治敵人可能存在的信任或幻想。

在整個事件中,Facebook 又扮演了怎樣的角色呢?

時間撥回 2015 年。CA 收購了科根和錢斯勒的 GSR 公司。科根繼續在劍橋大學工作,錢斯勒卻在這段短暫的工作結束后被 Facebook 招募到了硅谷總部,職位為「量化社會心理學家」(quantitative social psychologist)。

硅谷公司招人,就算不盤到祖宗十八代,也至少會把候選人的上家和前份工作內容問清楚。也就是說,Facebook 最早在 2015,甚至 2014 年就理應知道 CA 如何獲取 Facebook 最隱私的用戶數據,以及怎樣將它們用於政治用途用戶畫像的。

Facebook 在 2015 年就理應封閉 CA 的接口,徹查此事,並負起一家上市公司應負起的責任:告知公眾他們的用戶信息可能被用於未經授權的用途。

然而 Facebook 沒有這樣做。

至於 Facebook 是否有意借 CA 之手,為未來可能更需要操縱美國選舉做了一次 beta testing,那就不得而知了。


 

經過一個周末的發酵,CA、Facebook 都被推上了輿論的風口浪尖。

CA 的各種糗事被不斷曝光,被挖出跟有俄國政府背書的石油公司 Lukoil 共享統計模型和數據抓取方法;CEO 尼克斯和公司高管出現在了一則「釣魚採訪」的視頻里,向扮演成客戶的調查記者大吹自己和公司如何矇騙立法機構,在各國操縱選舉,甚至開黃腔抖出了曾在歐洲國家選舉中雇傭色情工作者勒索政客的事情。

在事件中成為關鍵爆料人之一的 CA 前員工懷利,也吸引到了大量的關注。和漩渦中的尼克斯、科根等其他人不同,懷利在關鍵的時刻選擇了站在揭露真相,而不是掩蓋真相的一邊。這讓曾經作為整個謊言機器關鍵螺絲,無論如何都無法洗刷罪惡的他,像是第二個愛德華·斯諾登 (Edward Snowden)。

Facebook 則被譴責沒有在三四年前就向監管機構和個人通報,長期忽視用戶信息安全。當地時間周二,英國議會直屬的信息專員辦公室(類似於中國工信部)已經向法院申請搜查令,對 CA 辦公室和其數字資產進行直接調查,並已經通知 Facebook 立即停止內部審計,以免其摧毀證據。

如果 CA 遭遇英美兩國信息安全法的審判,Facebook 恐已唇亡齒寒。

Facebook 發了聲明,但公眾並不買賬。美國時間周一中午,Facebook 股價一度暴跌 6.8%,市值蒸發 367 億美元。其創始人兼 CEO 馬克·扎克伯格今年一直在賣股票,而賣出的單子遇上了好時候:財經媒體 MarketWatch 估計,他在周一股價自由落體之前賣出的股票讓他少賠了 4000 萬美元左右——這筆錢足夠做總統競選宣傳了。

特朗普則一直在風口浪尖上。他在性醜聞和「通俄門」事件中沾的一身污水還沒洗乾淨,現在又被牽扯上 CA 助選事件。已經掌握了大量人證和物證的 FBI 特別檢查官羅伯特·穆勒 (Robert Mueller) 上周末應該挺忙。

最後,不妨看看《紙牌屋》里的威廉·康威是如何應對危機的:

康威與搜索引擎的合作終於引起了媒體的重視,如果放任不管,恐怕下一步就將迎來司法部的調查。雖然挖掘用戶數據屬於灰色地帶,法律沒有明確監管,但如果司法部指控網站非法盈利,那麼這筆賠償金誰都無法負擔。

威廉嘗試用政治手腕解決問題,但沒有成功。他不得不正面回應此事。他以朋友的身份與 Pollyhop 創始人一同露面,告訴大家自己所做的一切都是為了更好的了解民意,最後他與大家分享了自己漂亮妻子和可愛兒女的照片視頻,不僅提高了自己的人氣,還帶動了 Pollyhop 的流量。

反正扎克伯格肯定不會跟特朗普同框的。


想在手機閱讀更多電腦與科技資訊?下載【香港矽谷】Android應用
分享到Facebook
技術平台: Nasthon Systems