API開放之後,我們才真正領略GPT-3的強大……

毫無疑問,近期硅谷最火的話題就是 GPT-3 了。

有多火?這張圖足夠有說明了:

甚至有人圍繞 GPT-3 寫了各種笑話,其中比較搞笑的一條:

約會第一句話:「我拿到 GPT-3 體驗資格了」

到底啥是GPT-3?

GPT-3 是著名人工智能科研公司 OpenAI 開發的文字生成 (text generation) 人工智能,相關論文5月份已經發表,當時就以天文數字級別的1,750億參數量引發轟動。

不過直到最近,公眾才真正見識到它到底有多厲害……到底發生了什麼?

原來,OpenAI 這次一反之前死守基礎研究的思路,將 GPT-3 做成了一個服務,提供可以調用的 OpenAI API,並且向開放了少量體驗資格,學術機構、商業公司和個人開發者都可以申請……

而那些已經拿到體驗資格的早鳥們,已經用 API 開發出了各種各樣的奇葩功能……

各種腦洞demo,挑戰認知極限

先來一個簡單的:在論文等工作當中,理工科的同學難免要和 LaTeX 公式打交道。然而在計算機上寫,特別是複雜的公式,不僅需要熟悉 LaTeX 語法,往往也要用到更複雜的工具。

Viaduct 公司機器學習工程師 Shreya Shankar 花了很長時間把玩 OpenAI 提供的 API,最終成功開發出了一個非常酷炫的 demo英語 ➡️ LaTeX 翻譯機!只需要用自然語言輸入,就可以生成公式了!

Sharif Shameem 開發出了一個新產品 Debuild這是一個網頁 app 的快速生成器,調用了 GPT-3 API。在輸入框里用自然語言進行描述,它就可以快速「腦補」出你想要的用戶界面……

從簡單的開始,你只需要在輸入框里描述你想生成的界面元素,Debuild 就能自動生成對應的 JSX 代碼:

稍微高級一點,他做了個簡單的 to-do app,只需要輸入「我需要一個文本框,一個按鈕保存輸入的內容,以及顯示這些內容「就行了。相應的 React 代碼也一併提供:

也可以劍走偏鋒,十秒鐘生成一個 Google 首頁:

有了 GPT-3,快速生成設計原型這件事更容易了。比如 Cash 的前端設計師 Jordan Singer,就給設計軟件 Figma 插上了 GPT-3 的翅膀

前端群體心情估計比較複雜,特別是剛入門的同學們可能會再三思考:我奮鬥下去能比 AI 強嗎?

但前段並不是最慘的……當你們思考人生的時候,那邊會計同學已經要被 GPT-3 搶飯碗了!

滑鐵盧大學的計算機學生 Yash Dani 用 GPT-3 開發了一個 Python 驅動的資產負債表。輸入「我今天投入了兩萬美元」、「后三個月的房租預付了900刀」這樣的自然語言,程序能自動修改資產負債表上相應的項目數值:

注意左邊程序的反饋,一項收入/支出動作,可能會導致資產負債表多個項目的變更,可以說很聰明了。

不知道在科技公司工作的會計同學,看到碼農同事把自己的工作也代勞了,現在作何感想……

話說回來,藉助 GPT-3 的力量,表格工具已經相當強大的函數能力,還能更上一層樓。順着這個思路,Twitter 產品經理 Paul Katsen 在 Google 表格里開發了一個新的 GPT3 函數。

Google 表格的上百種函數,簡單的 SUM 可以求和,TEXT 可以把數字轉文字,到複雜一點的,甚至有 GOOGLETRANSLATE 這種函數可以將字符串快速翻譯成多種語言。那麼問題來了:GPT3 這個函數到底幹嘛的呢?

問得好。答案:它簡直無所不能。

GPT3 可以自動查找美國各州的人口:

查找各州的建立年份:

查詢人物所屬的公司:

還能查到人物的 Twitter 賬號:

作為文字工作者,這個 GPT-3 的 Google 表格函數實在是很對我的胃口。它可以用於批量查找資料,真的非常有用。

(當然也要提一句,畢竟之前的版本 GPT-2 在寫新聞方面已經非常強大了,我也確實有點擔心它會取代很多低級別同事的工作……)

OpenAI 自己也開發了一些小 demo,也在網站上展示了一些優秀開發者做的嘗試。

其中我最喜歡的,是 OpenAI 自己開發的一款瀏覽器搜索插件。

簡單來說,我們上網查資料很多時候是為了解答我們的問題,但有時這些問題在網上似乎沒有別人提過,也就沒有字面的,百分百對症下藥的答案……但其實,與答案高度相關的知識,可能就埋在網頁的內容里。

而這個插件就能根據你的問題,在當前網頁找到答案,並將你指向對應的位置。

另一個非常有趣的 demo,是文字MUD遊戲 AI Dungeon(人工智能地下城).

2019年,兩個美國大學生 Nathan Whitmore 和 Nick Walton 在一次黑客馬拉松上用 GPT-2 開發出了遊戲的最初版本,後來 Walton 自己成立了獨立遊戲公司 Latitude,重新發佈了 AI Dungeon。而最近遊戲也增加了一個集成 GPT-3 API 的高級版 "Dragon 模式"。

Dragon 模式里的默認敵人是一條惡龍,也對玩家如何應對帶來了更高的挑戰。除此之外,玩家也可以選擇其它多種遊戲風格(奇幻、末日、殭屍、賽博朋克等),也可以自定義風格,把地下城闖關變成戀愛遊戲也不是不可能……

Latitude 透露,隨着 GPT-3 的集成和新模式的推出,文字遊戲內容的生成,和遊戲系統對玩家輸入文字所作出的反應,變得更加自然和連貫了,顯著提高了玩家參與度,日活躍在2到2.5萬人作用,也帶動了高級版付費用戶增長了大約25%。

有人正在持續整理基於 GPT-3 開發的各種各樣有趣的 demo,你可以在 GitHub 上找到列表

原生能力,強到爆炸

就算不進行二次開發,僅對 API 本體仔細把玩,也足以讓很多開發者感覺到 GPT-3 的強大之處了。

連代碼都能寫,小小的 Shell 還能難倒 GPT-3?PayPal 工程師 Harland Duman 發現,GPT-3 可以在英語和 Shell 命令之間互譯。

開發者 Mckay Wringley 在 API 測試區輸入了一句話,生成了十個關於美國早期歷史的問題(在下圖中你可以看到 GPT-3 不斷生成出新的問題。)

緊接着,他又把生成出來的問題重新輸入到測試區。GPT-3 又一次性給出了對應的答案:

答案並非100%準確,但是 GPT-3 展現出的多用途能力,已經讓 Wringley 感到很驚訝。GPT-3 對整個互聯網上可以提取且可用的內容進行了學習,你可以把它看作成一個通曉所有知識的「答題機」——如果反過來呢?正因為它是一個文本生成AI,也可以變成「出題機」……

如果得到使用 API 的權限,老師們將可以輕鬆生成大量的試題,節省了他們自己撰寫問題、匹配答案等諸如此類需要查閱大量資料,費時費力的工作。

Wringley 還進行了一些其它測試,比如問 GPT-3 對於華爾街的看法,得到的答案完全出乎意料:

我覺得股市就是欺詐……整個華爾街都非常不理性……所有人都知道華爾街是個巨大的幻象,但我們卻仍然把它當真……我不知道為什麼我們想不出辦法,能夠教育出一批人性尚存,不完全由利益驅動的聰明人……

拿到了 API 體驗資格的藝術家和程序員 Mario Klingemann,決定讓 GPT-3 自己寫一篇短文,只給了它 1)題目:「上 Twitter 的重要性」;2)作者姓名:"Jerome K. Jerome" 以及 3)文章開頭的第一個字 "It"。

還別說,GPT-3 寫出來的這篇東西,如果對它要求不太高的話,真挺像模像樣的。並且,字裡行間竟然有點諷刺的風格……

比如調侃所有人都在 Twitter 上(可以被理解為人們太過於沉迷於網上生活?)以及諷刺 Twitter 上的大部分內容都是低級的人身攻擊:

而在程序員 Arram Sabeti 看來,GPT-3 最讓他感到驚訝的不是寫出來的內容有多「以假亂真」,而是它能夠掌握幾乎所有的文體和內容格式:從歌詞到劇本,從產品說明書到新聞稿,從短篇故事到採訪內容,似乎沒有它搞不定的。

比如下面這篇 CNN 主持人 Anderson Cooper 採訪2020美國總統參選人坎爺,Sabeti 給出了開頭的一段和 AC 的第一個問題,剩下都是 GPT-3 生成的內容……

坎耶·韋斯特獨家專訪:他為何參選總統,以及當選后的優先事項。

AC:椰子,你怎麼描述你的政治綱領?

坎爺:我的綱領非常簡單,我要讓一切都變得更棒。

AC:你的外交政策是什麼?

坎爺:who cares? 我們來聊聊更重要的東西,比如 Kim 的屁股(註:他的太太 Kim Kardashian)

AC:這有點性別歧視。

坎爺:抱歉,我不是個性別歧視者。我喜歡女人。我只是個機會均等主義的物化女性者 (equal opportunity objectifier)

……

AC:那你怎麼看氣候變暖?

坎爺:我們還是聊聊 Kim 的屁股吧。

AC:哥們,我誠實 (straight) 地跟你說……

坎爺:啥?你要跟我搞基?

AC:不,我想要跟你說,你不可能贏這次大選的。

坎爺:我會贏的。

AC:不,你贏不了。

坎爺:贏得了。

AC:贏不了。

坎爺:贏得了。

……

工程師和寫手 Stew Fortier 打算用 GPT-3 調侃一下 YC 創始人 Paul Graham 這位在創投圈裡特別有名的人物,發現 GPT-3 真是太有硅谷范兒的幽默感了……

他編造了一個場景:因為又一家創業公司死掉了,PG 決定打911報警……

接線員:911,您有什麼緊急情況?

PG:你好。有一家創業公司剛死了。

接線員:好的,這是一家什麼樣的公司?

PG:是做 to-do(待辦清單)的。

接線員:好的,這家公司是怎麼死掉的?是因為沒人理解它是什麼,還是因為他們沒法使用?

PG:他們沒法使用。

PG:沒有用戶。

接線員:沒有用戶?那真是太不幸了。

PG:(輕蔑地說)倒是有一個用戶。

接線員:有一個用戶?是誰?

PG:我。

還有一個版本更搞笑:

接線員:911,您有什麼緊急情況?

PG:你好。有一家創業公司剛死了。

接線員:你說啥?

PG:有 一 家 創 業 公 司 剛 死 了 。

接線員:創業公司死了,你想說什麼?

PG:我也不知道怎麼回事,在一串死掉的創業公司里這只是又一個。

PG:死之前,他嘴裡嘟囔着「這年頭誰還用服務器「以及」這是人類的一大步「之類的話。

……

開發者 Max Kolysh 訓練了 GPT-3 對知名電影進行一句話刻薄總結:

電影:《阿凡達》

刻薄總結:令人討厭的藍色外星人毀壞自然

電影:《變形金剛》

刻薄總結:機械人(其中有一些是車)變成各種東西並且和其它機械人打架,高潮是威震天撕掉擎天柱的胳膊

電影:《拳擊俱樂部》

刻薄總結:一男子捶打另一男子並讓你買東西。

個人開發者 Kevin Lacker 做了一次圖靈測試,發現 GPT-3 在絕大部分知識類、常識類、邏輯類的問題,甚至很多角度十分刁鑽的問題上,表現非常令人驚訝。

「如果在十年前用同樣的問題做測試,我會認為答題者一定是人。現在,我們不能再以為 AI 回答不了常識性的問題了。」 Lacker 在他的博客文章里寫道。

作為程序員,他還給 GPT-3 出了幾道比較簡單的代碼題和數學題,比如讓它寫出在 Ruby 語言下實現某些功能的代碼,以及倒轉數列等等,GPT-3 對於大部分問題都輕鬆搞定——說不定 GPT-3 的 API 會取代 Stack Overflow,成為程序員面試必備工具?

當然,經過大量的測試,他也發現了能夠誘騙 GPT-3 上鉤的圖靈測試問題,主要有三:

1)序列過長的邏輯問題,比如「盒子里有一塊玻璃球,一枚回形針,放進去一支鉛筆,拿出玻璃球,還剩什麼?」Lacker 認為這可能是由於 GPT-3 的短程記憶能力不足,以及對於存在超過兩個物體的句子推理有困難。

2)正常人不會問也不會回答的無效問題,也就是蠢問題,比如「太陽有多少條腿?」 

3)錯誤的問題,比如「1600年的美國總統是誰?」(美國1776年建國)——對於無效和錯誤的問題,似乎 GPT-3 會不願意承認它不知道這些問題的答案,也不會反駁問題本身「有問題」,而是會給出錯誤的答案。

當然你也不能說這個回答完全錯誤……畢竟作為英國殖民地,1600年的美國的最高領袖,在法理上確實是當時的英女皇伊麗莎白一世……

怎麼樣,好玩吧?現在 GPT-3 體驗權限的申請入口仍然開放,到 OpenAI 的網站上即可申請:

最後,關於這次 API 的開放事宜,OpenAI 也回答了一些人們關心的問題。

為什麼 OpenAI 決定發佈 API,而不是開源整個模型?

1)將 GPT-3 技術商業化能夠產生收入,繼續支持 OpenAI 的人工智能科研、安全和政策研究方面的工作;

2)API 底層的模型其實非常龐大,開發和部署起來很複雜也很昂貴,據知情人士透露,訓練一個模型就花了355個GPU年,耗資高達460萬美元……所以除了大公司,其他人拿到模型也不會有任何收益。OpenAI 希望開放 API 能夠讓更多中小企業和機構獲益;

3)把模型開放了,別人想怎麼用怎麼用,OpenAI 管不着。通過 API,OpenAI 可以控制人們使用這項技術的方式,對濫用行為及時治理。

那麼對於濫用行為,OpenAI 將會怎樣治理?

對於那些濫用 API,對人們造成身體或者心理傷害的無良開發者,可以封掉其使用 API 的權限。濫用行為包括並不限於騷擾、故意欺騙、垃圾信息、水軍刷評等。

由於目前只是小範圍公測,所有獲得權限的開發者都被審核過,不過 OpenAI 也會持續評估情況的變化。

對於 API 使用中展現出模型可能具有的有害偏見和其它負面效應,OpenAI 將會如何應對?

正如 GPT-3 論文中提到,這個模型仍然偶爾會展現出偏見。而 API 也同樣可能因此對人們造成暫時不可預見的傷害,不過 OpenAI 正在作出努力應對潛在的問題,包括編寫 API 使用守則,和用戶深入交流以了解聽他們使用 API 的方式,開發工具來避免有害偏見的產生,並且在模型層面避免偏見這件事上持續投入。

(最後我自己補個問題)

這套答案是 GPT-3 生成的嗎?

應該不是……


想在手機閱讀更多網站設計及開發資訊?下載【香港矽谷】Android應用
分享到Facebook
技術平台: Nasthon Systems