北京時間6月14日,在計算機視覺領域國際頂級會議CVPR 2025上,騰訊宣布混元3D 2.1大模型對外開源,這是首個全鏈路開源的工業級3D生成大模型,達到了閉源級水平。
相較於廣受社區歡迎的混元3D 2.0,2.1模型優化了幾何生成的質量,同時開放了PBR(基於物理的渲染)材質生成大模型,進一步提升3D資產的質感和光影表現,將AI 3D開源模型的可用性推進至全鏈路可用階段。
騰訊混元3D模型負責人郭春超表示,混元3D 2.1的全面開源是一個新起點,期待與全球開發者、創作者及研究者攜手,共同打造更加繁榮的3D開源生態。
幾何與紋理雙優化,PBR技術提升真實感
如果說幾何是3D模型的「骨骼」,定義了模型的形態、輪廓與細節精度;紋理則是3D模型的「皮膚」,還原模型表面的顏色、光澤和細節表現。
在混元3D 2.0的基礎上,混元3D 2.1模型進一步強化了「幾何-紋理解耦」架構。
基於DiT幾何架構,混元3D 2.1優化了細節建模,使網格精度更高,具備更好的形狀一致性,為後續紋理映射提供了堅實的基礎。同時,混元率先在3D開源模型中引入PBR紋理生成技術。基於多視圖生成、逆渲染和貼圖技術,混元3D 2.1 可生成基礎顏色、金屬度、粗糙度等貼圖,支持皮革、木質、金屬、陶瓷等多種複雜材質的高質量渲染。
混元 3D 2.1 模型與主流 3D 模型紋理效果對比
混元 3D 2.1 模型與主流 3D 模型幾何效果對比
混元 3D 2.1 模型與開源 3D 模型的幾何&紋理生成性能對比
相較傳統RGB 貼圖技術,PBR通過模擬光線與材質的物理交互,提升模型在不同光照環境下的視覺一致性。在用戶盲測中,混元3D 2.1的PBR紋理相較於RGB貼圖,質感勝出率高達78%。
這種物理真實性不僅滿足電影、遊戲等高要求渲染場景的需求,也為工業設計、虛擬仿真和數字孿生提供了可靠3D資產。此外,PBR材質的標準化特性使其兼容主流渲染引擎(如Unreal Engine、Unity),提高了3D資產在跨平台、跨行業的復用性,推動3D模型從消費級創作向工業級應用的轉型。
全鏈路開源,降低開發門檻
混元3D 2.1大模型在效果全面升級的基礎上,提供了模型權重、訓練代碼和數據處理流程的全鏈路開源,開發者可以自由微調、二次訓練或優化,滿足定製化需求,同時為學術研究提供平台。
在部署方面,混元3D 2.1適配於消費級顯卡,在Github 等開源地址提供了詳細部署和使用教程,企業、中小團隊及個人開發者都能輕鬆上手。
據悉,騰訊遊戲自研編輯器輕游夢工坊已應用混元 3D在多條美術管線完成提效,道具管線製作周期由2天/個降低至0.2天/個,相信模型開源有望加速3D內容創作的普及。
持續突破,助力開源生態繁榮
騰訊混元3D致力於通過AIGC技術重塑3D製作管線,致力於解決傳統3D建模耗時、成本高、數據稀缺等行業痛點。
自2024年11月發佈並開源首代3D生成模型以來,騰訊混元持續迭代創新。2025年1月,混元3D 2.0在文本一致性與幾何精度上超越主流模型;3月,一次性開源5款3D生成模型,實現秒級資產生成;4月,混元3D 2.5模型精度提升超10倍,邁入超高清時代。
此前,騰訊還發佈了面向創作者的3D AI創作引擎。該引擎支持文生、圖生以及多視圖輸入功能,同時具備智能拓撲能力——通過自回歸技術生成拓撲結構接近手工布線的低模, 並整合了多套適配3D設計師需求的專業工作流,涵蓋角色/道具設計等場景,可充分滿足遊戲開發、動畫影視及3D打印等領域的專業需求。
騰訊混元堅定擁抱開源,旗下圖像、視頻、3D、文本等多種模態基礎模型已全面開源。作為最受歡迎的 3D 開源模型之一,混元3D模型在Hugging Face平台下載量已超過180萬,廣受全球開發者認可。
開源主頁:https://3d-models.hunyuan.tencent.com/
Hugging Face: https://huggingface.co/tencent/Hunyuan3D-2.1
Github: https://github.com/Tencent-Hunyuan/Hunyuan3D-2.1
混元3D生成引擎: https://3d.hunyuan.tencent.com/
附:其他參考資料
【新聞稿-大眾版本】騰訊混元3D 2.1開源:讓AI 3D 模型告別「塑料感」
【素材包】Hunyuan3D-v2.1 demo