2月,OpenAI 的視頻生成模型 Sora 橫空出世,讓不少國內視頻賽道和 AI 賽道的廠商都沒能過個好年。外界看來,海外的技術已然如此成熟,而國內卻似乎沒人能夠與其一競高下。
而事實上,中國廠商在音視頻生成上的技術積累一直沒有停止過。
4月18日,2024中國生成式AI大會在京舉辦,AIGC軟件A股上市公司萬興科技(300624.SZ)受邀參會,並重磅宣布旗下音視頻多媒體大模型萬興「天幕」將於4月28日正式公測,以通過廣泛的用戶參與和反饋,進一步優化「天幕」性能和體驗,同時探索多媒體大模型技術在不同領域的應用潛力。
當前,萬興「天幕」大模型已通過中央網信辦備案,能力方面已涵蓋文生視頻、視頻生視頻、文生音樂、視頻配樂、文生音效、文生圖、圖生圖等原子能力,相關能力已在萬興科技旗下產品規模化商用。其中文生視頻能力上,已實現不同風格、豐富場景及主題的連貫性,且一鍵生成時長支持60秒+。
萬興天幕大模型4月28日公測
作為國內首個音視頻多媒體大模型,萬興「天幕」聚焦數字創意垂類創作場景,基於15億用戶行為及百億本土化高質量音視頻數據沉澱,以音視頻生成式AI技術為基礎,打造基於大模型架構的AIGC應用基礎底座,全鏈路賦能全球創作者,推進大模型進入2.0時代。
未來,萬興「天幕」近百項音視頻原子能力將全面集成到公司矩陣產品中落地應用。公測期間,公司將重點開啟視頻創意、音頻創意、圖像創意等領域多個場景下的應用測試,如文生視頻、視頻生視頻、文生音樂、文生音效等。其中,視頻生視頻功能支持一鍵視頻風格轉換,讓畫面更出彩;文生音樂、文生音效進一步升級對文本的深度理解,以及基於內容理解生成對應風格音頻的多維整合能力,支持輸入文本生成擬真聲音及倍速音效。
萬興「天幕」文生視頻《男孩的探險之行》畫面截圖
大會上,萬興科技副總裁朱偉同阿里、騰訊、英偉達等企業嘉賓,以及北大、清華等學術嘉賓在內的超50位重量級產學研投界代表同台論道,並帶來《音視頻多媒體大模型市場洞察與落地實踐》主題演講。
過去的2023年,大模型作為基礎設施賦能千行百業,呈現井噴式增長,給行業帶來了超乎尋常的改變。據不完全統計,2023年國內公開發布的大模型產品已達238+個,大模型產業競爭真正進入「百模大戰」階段。其中,絕大多數產品均以自然語言對話為主要功能,提供聊天對話、創意寫作、代碼生成等服務。
朱偉指出,當前大模型在文本和圖像領域已實現生產力商用,但在音視頻領域的應用還存在數據集缺失、視頻內容結構及層級複雜、算力成本高等挑戰,其成熟應用尚需周期。根據硅谷知名風投公司a16z調研結果顯示,在2023年以前,市面上尚不存在公開的視頻模型,但2023一年內誕生的模型就達數十個,全球用戶數量超過百萬級。目前,市場上已投入使用並取得一定進展的AI視頻模型數量達到21個。
朱偉同時表示,當前AI視頻模型尚不成熟,但伴隨行業發展,大模型正在從1.0圖文時代加速進入以音視頻多媒體為載體的2.0時代,2024年將迎來AI視頻年,AI視頻大有可為。目前萬興科技深耕創意軟件20餘年,在音視頻數據、跨模態和多媒體技術上有豐富積澱,並對全球多媒體創作者有更為深刻的理解,現在的萬興「天幕」也許不盡完美,但正因為不完美,才更對未來無限憧憬,並願為之不懈努力,相信公司會朝着新生代AIGC數字創意賦能者道路闊步前行。展望未來,萬興「天幕」將堅持內部應用、外部開放并行,向外部企業逐步開放API接口,期待更多行業夥伴加入,共築音視頻多媒體大模型開放生態,攜手共赴AI大時代。
萬興科技副總裁朱偉作《音視頻多媒體大模型市場洞察與落地實踐》主題演講
隨着數字化轉型的加速和AI技術的廣泛應用,多媒體內容創作市場在快速增長。公開資料顯示,目前,全世界有3.05億視頻創作者,43億視頻覆蓋群體,每天200億次以上的視頻播放量,視頻需求非常大。另據QYResearch最新研究顯示,預計2029年全球專業音視頻系統市場規模將達到3632.7億美元,未來幾年年複合增長率CAGR為5.0%。
推出萬興「天幕」的萬興科技是中國數字創意軟件領域產品覆蓋面廣、營收體量大、全球化程度高的A股上市公司,也是國內AIGC行業龍頭企業,業務覆蓋200多個國家和地區,全球累計用戶超15億,月活近1億,被視為「中國版Adobe」。
成立20年來,萬興科技一直緊跟技術浪潮,與時俱進洞察市場需求,針對性賦能不同階段的內容創作。面向全新展開的AIGC時代,萬興科技錨定數字創意創作場景,已推出萬興愛畫、萬興播爆、Wondershare Kwicut、Wondershare VirtuLook等AIGC創意新品;旗下萬興喵影、Wondershare PDFelement、萬興PDF、億圖圖示、億圖腦圖、墨刀等產品均已集成AIGC能力,並持續優化上新,用AI讓世界更有創意。
雷峰網