編輯:沈筱
微軟發佈1.3B參數量小模型,效果優於7B參數Llama2
9月11日,微軟發佈開源模型phi-1.5,在只支持代碼的1.0版本之上加入了一般場景對話。該模型的參數量只有1.3B,但效果已經超過了擁有7B參數的Llama2。phi團隊一致認為,數據的質量遠比數量更重要。所以與一眾卷參數量的模型相比,phi-1.5不僅參數量不到Llama2的五分之一,訓練時所用的token更是少了一個數量級,只用了3千億的訓練數據。但phi-1.5在AGIEval、 LM-Eval等多個Benchmark上都取得了比Llama2還要優異的成績。
https://www.sohu.com/a/721106310_610300
英偉達 GH200 超級芯片首次亮相 MLPerf v3.1,性能躍升 17%
9月11日,推出不到兩個月的英偉達GH200 Grace Hopper超級芯片首次亮相MLPerf行業基準測試。在此次測試中,具有更高的內存帶寬和更大的內存容量的GH200與H100 GPU相比,性能高出17%。此次MLPerf Inference v3.1基準測試是繼4月發佈3.0版本之後的又一次更新,這次更新包含了兩個方面:引入基於60億參數大語言模型GPT-J的推理基準測試(AI模型的大小通常根據它有多少參數來衡量)和改進的推薦模型。
https://www.thepaper.cn/newsDetail_forward_24580685
Meta計劃對標GPT-4訓練下一代大模型
9月11日消息,Meta購入大量英偉達H100芯片,並積極擴建數據中心,減少對微軟Azure雲平台的依賴,以創建一款更為強大、複雜的聊天機械人。Meta 將 GPT-4 作為其下一個 AI 模型的標準,並計劃在2024年開始訓練,旨在模仿人類的表情和感情,提供更加逼真的交互體驗。根據此前泄露的消息,Instagram正在測試一個具有30種性格的聊天機械人,可能與公司即將推出的未公布的人工智能「角色」相關聯。
https://new.qq.com/rain/a/20230911A04IZL00
位元組跳動旗下「悟空搜索」App更名「小悟空」,提供200+AI工具
9月11日消息,位元組跳動於去年推出「悟空搜索」App,主打「無廣告搜索」。現在,這款 App 宣布更名為「小悟空」。小悟空 App 內包含基於大語言模型的 AI 工具合集,支持智能對話和輔助推薦功能。智能工具分類包括創作生成、學習提升、工作職場、專業諮詢、虛擬角色、休閑娛樂等,用戶可以使用該工具進行翻譯、法律諮詢、趣味測試等操作。
https://www.ithome.com/0/718/425.htm
研究發現ChatGPT可在七分鐘內完成軟件開發,平均成本不足1美元
9月12日消息,來自布朗大學和多所中國大學的研究團隊進行了一個實驗,探究是否可以用 ChatGPT 的 3.5 版本的語言模型來驅動的人工智能機械人,在沒有事先訓練的情況下完成軟件開發過程。研究者創建了一個假想的軟件開發公司,名為 ChatDev。研究表明,這個由人工智能驅動的公司平均可以在不到七分鐘內以不到一美元的成本完成整個軟件開發過程,同時通過其「記憶」和「自我反思」的能力識別和解決「潛在漏洞」。
https://www.ithome.com/0/718/638.htm
國內外高校聯合開源強化學習策略,讓機器狗能跑酷
9月12日消息,來自上海期智研究院、斯坦福大學、上海科技大學、卡內基梅隆大學和清華大學的研究者聯合開展了一個項目,旨在通過開源強化學習策略讓機器狗掌握多樣化的通用技能,以迅速應對各種場景和障礙。該項目基於一種新的開源系統,可以學習基於視覺的端到端跑酷策略,無需依賴任何參考動作數據。這種強化學習方法能夠讓機器狗學會攀爬高障礙、跳過大間隙、在低障礙下爬行、擠過狹小縫隙和跑步等技能,並將這些技能整合成一個基於視覺的跑酷策略,可以直接部署到四足機械人上。
https://new.qq.com/rain/a/20230912A04MBX00
用戶反映llama2.mojo實現比llama2.c快20%的效果
9月12日消息,一名Mojo社區成員將Python程序llama2.py移植到Mojo上,實現了比原版llama.c快20%的效果,顯示了Mojo在硬件級優化方面的巨大潛力。Mojo是一種新的面向AI開發人員的編程語言,其目標是將Python的易用性與系統編程功能結合,實現高性能計算。Mojo可以無縫集成Python代碼和庫,同時提供與C++和CUDA相匹配的性能。Mojo的發明者Chris Lattner表示,他創立的公司Modular新獲得的1億美元融資將用於推動Mojo的進一步發展和產品擴展。
https://finance.sina.com.cn/tech/roll/2023-09-12/doc-imzmmpkq5281189.shtml
騰訊健康公布醫療大模型,併發布AI醫療產品矩陣
9月12日消息,據騰訊健康官方公眾號報道,騰訊健康在日前公布了旗下醫療大模型,併發布「智能問答、家庭醫生助手、數智醫療影像平台等多場景 AI 產品矩陣」,以及藥物發現平台「雲深」(iDrug)。這一醫療大模型基於騰訊混元大模型,適用於文案生成、智能問答、病歷結構化和檢索、影像報告和輔助診斷等場景,可嵌入醫療環節全流程;同時,在 AI 驅動藥物發現方面,騰訊宣稱,旗下 「雲深」(iDrug)平台已同時具備了小分子藥物與大分子藥物的加速發現能力。
https://www.ithome.com/0/718/473.htm
Adobe Firefly 生成式 AI 模型全面開放商用
9月13日消息,Adobe宣布,經過幾個月的測試,Firefly生成式AI模型已正式上線,可在Adobe Creative Cloud、Adobe Express和Adobe Experience Cloud等多個應用中使用。此外,Adobe還推出了一個獨立的Firefly網頁應用,讓用戶在不使用特定的Adobe Creative Suite應用的情況下,也可以體驗生成式AI的功能。
https://www.ithome.com/0/718/969.htm
華人團隊提出Medusa簡單框架,可將LLM推理速度提高2倍
9月13日消息,來自普林斯頓、UIUC等機構的華人團隊提出一個用於加速大型語言模型(LLM)推理速度的簡單框架Medusa,並於9月12日開源發佈。Medusa通過增加多個解碼頭來加速模型的推理速度,而無需引入額外的草稿模型,這種方法允許研究人員在單個GPU上微調大模。測試結果顯示,Medusa可以將LLM的生成效率提高約2倍。
https://www.chinaz.com/2023/0913/1558833.shtml
清華聯合北郵和微信團隊推出多智能體宇宙,可模擬各類社會實驗場景
清華大學聯合北郵和微信團隊推出了一個名為「AgentVerse」的多智能體宇宙,專門針對大語言模型開發,已在GitHub獲得1.1k星標。該項目簡化了使用大語言模型構建自定義多智能體環境的過程,只需幾行簡單配置即可模擬各種社會實驗場景,如「囚徒困境」和「NLP課堂」。
https://www.thepaper.cn/newsDetail_forward_24583658
阿里雲通義千問 AI 大模型已通過備案,正式向公眾開放
9月13日消息,阿里雲今日宣布通義千問大模型已首批通過備案,並正式向公眾開放。目前,OPPO、得物、釘釘、淘寶、浙江大學等已與阿里雲達成合作,基於通義千問訓練自己的專屬大模型或開發大模型應用。
https://www.ithome.com/0/718/755.htm
知網推出「AIGC 檢測服務系統」,用以識別學術文本中AI 生成內容
9月13日消息,同方知網官網今日發佈公告,宣布全新推出「AIGC 檢測服務系統」,號稱歷時半年,探索 AIGC 運行規律並攻克內容識別、算法效率、可信評估等技術難題,經大數據測試、檢測效果驗證、檢測效率調優等服務優化改進。首次提出「知識增強 AIGC 檢測技術」和若干檢測算法,從語言模式和語義邏輯兩條鏈路,用 AI 對抗 AIGC,最終實現識別學術文本中的 AI 生成內容。
https://www.ithome.com/0/718/925.htm
Stability AI 發佈文本生成音頻產品Stable Audio
9月14日消息,Stability AI 公司近日推出 Stable Audio,可基於用戶輸入的文本內容,自動生成多種類型和風格的音頻內容,包括音樂、語音、環境聲、特效等。Stability AI 宣稱,Stable Audio 模型可以在一秒內渲染出 95 秒的立體聲音頻,並且只需要一個 NVIDIA A100 GPU。
https://new.qq.com/rain/a/20230914A015WO00
谷歌被曝小範圍測試Gemini,比訓練GPT-4算力大5倍
9月15日消息,據三位直接知情人士透露,谷歌已經允許一小部分公司使用 Gemini 軟件的早期版本,意味着谷歌即將將其納入消費者服務,並通過公司的雲計算服務出售給企業;同時,Gemini 已開始在新的 TPUv5 Pod上進行訓練,算力高達~1e26 FLOPS,比訓練 GPT-4的算力還要大5倍;另外,Gemini 的訓練數據庫為Youtube上 93.6億分鐘的視頻字幕,總數據集大小約為GPT-4的兩倍。
https://36kr.com/p/2432997666886022
微軟開源EvoDiff,用AI生成蛋白質框架
9月15日消息,微軟開源了一個蛋白質生成框架EvoDiff。該框架使用AI技術,能夠在沒有目標蛋白質結構信息的情況下,生成生成高保真、多樣化的蛋白質序列。EvoDiff的核心是一個擁有6.4億參數的模型,該模型通過使用來自不同物種和功能類別蛋白質的數據進行訓練,使模型具備生成高質量蛋白質序列的能力。創新之處在於,它不再依賴蛋白質結構信息,而是基於蛋白質序列來生成蛋白質。
https://www.kejixun.com/article/582034.html
Arm正式IPO,上市首日大漲近25%
9月14日,作為今年目前最大IPO,英國芯片設計公司ARM正式登錄納斯達克,首日漲超25%,市值達650億美元。當今幾乎所有的手機芯片,都是基於ARM的架構設計的,除此之外,ARM架構在汽車、智能手錶等行業也有較高的市佔率。ARM表示,由於數據中心和人工智能芯片需求的推動,預計本財年收入增長11%,2025財年收入增長率能達到20%左右。
https://36kr.com/p/2432884592546432
位元組團隊發佈兩個AI視頻項目,可實現多模態動畫生成和文本視頻編輯
9月15日消息,位元組團隊在Github上發佈兩個AI視頻項目。一個是MagicAvatar,主多模態動畫生成,可以將文本、視頻和音頻等不同輸入方式轉化為動作信號,從而生成和動畫化一個虛擬人物;另一個是MagicEdit,專註文本導向的視頻編輯,用戶進行自然語言提示,就可改變視頻風格、場景甚至替換視頻里的對象或添加元素。目前在Github上,兩個項目加起來已經拿到1000+星。
https://36kr.com/p/2417388284961540
百度希壤與高通達成戰略合作,擬打造元宇宙基礎設施平台
9月15日消息,近期,北京百度網訊科技有限公司與高通無線通信技術(中國)有限公司在北京簽署非約束性戰略合作諒解備忘錄,將在XR領域展開全面戰略合作。通過此次戰略合作的宣布,雙方期望在未來開展深度的技術、市場與生態合作,其中包括雙方將在XR技術、生成式AI、數字人、產業上下游協同等方面,圍繞元宇宙+生態+行業應用共同打造新一代元宇宙基礎設施平台。
https://www.chinaz.com/2023/0915/1559598.shtml
國內多個AI繪畫網站疑因違規關停
9月15日消息,國內多個基於AIGC技術建立的AI繪畫網站突然下線。目前,像廣大網友熟知的四必三、哩布哩布等紛紛在無預警情況下被關停,或轉移到境外域名,並在國內無法正常訪問。不少網友懷疑合規方面或出現問題。
https://mp.weixin.qq.com/s/HdwLkkhyD6OWlO4gUppVuQ
快手開啟AI 文生圖功能內測
9月15日,快手宣布在短視頻評論區開始內測 AI 文生圖功能 —— 快手 AI 玩評,用戶通過輸入各種創意文字,可一鍵生成海量風格圖片,更便捷地在評論區進行趣味互動。據悉,這是繼快手 AI 對話之後,快手在短視頻場景內探索並落地的又一 AIGC 能力,這也是業內首次在大型 App 核心業務場景評論區下應用的 AIGC 能力。
https://www.ithome.com/0/719/336.htm