
引語:
2025 年,百度的「天」變了。
「前 Deepseek 時代」,圈裡不少人還悲觀地認為,中國沒有模型能跟上 GPT 的腳步,對百度來說,模型不掉隊,應用生態做起來,就能夠留在牌桌上;
而 Deepseek 一出,風雲變幻、誰與爭鋒——原本,文心 4.0 在國內也算數得上號的大模型,在 Deepseek 面前,也不得不甘拜下風。
於是,巨大的壓力給到了百度:
發新模型,必然面臨質疑,要被拿去在顯微鏡下和 Deepseek 作比較,在冷眼下遭遇批判;
不發新模型,百度的技術實力更沒了展現的機會,無端的猜測又會甚囂塵上,客戶的信心也會被損傷。
進退維谷,百度的選擇,是亮出寶劍,非要試一試自己的成色——即使面臨批評和貶損,百度也決心放下面子,把自己最新的模型成果展示出來。
放下面子,拼了老命,也死活不下牌桌,百度是怎麼想的?
一、文心 4.5 和 X1,百度「死磕」
談戰略之前,先聊點實着的——百度新發的文心 4.5 和 X1 好用嗎?
作為百度新一代的原生多模態大模型,文心 4.5 首先是在多模態的能力上進一步升級。今天的文心 4.5,不僅可以理解照片、工作圖表、視頻內容,準確摘取靜態、動態圖像中的細節信息;甚至還能理解網絡笑話、梗圖中的幽默和諷刺,並連貫地完成推理。
當大模型能力越來越卷、用戶標準越來越高,模型之間最細微的差距,就決定了實際生成結果在體驗上的天差地別——原生和非原生的區別,也由此顯現。
預訓練階段更深層次的模態融合、專為跨模態交互和理解設計的模型機制,都是原生多模態模型的優勢。
3月,李彥宏在人民網上發表了一篇署名文章,其中就提到了原生與非原生多模態大模型的區別——原先,所謂的「多模態模型」,只是幾個單模態模型訓練后再進行拼接;而原生多模態大模型,勝在以統一的架構,去實現對複雜世界的統一理解。
本次發佈的文心 4.5,在原生多模態的角度,思路與谷歌的 Gemini,Meta 的 Llama 4,OpenAI 的 GPT-4o 一致。
而文心 4.5,則是在多模態異構專家擴展技術上更進一步,就如同根據圖像、視頻、文字等不同領域,給智囊團請來了一群術業有專攻的「專家」,並且通過一套自適應模態感知損失函數,讓「專家」們可以實力相當,也就更能完成協作,執行複雜跨模態任務的處理。
多模態能力之外,針對大模型不少老生常談的技術難關,百度在文心 4.5 也交上了這一期的「答卷」:
面對長文本處理問題和多輪交互,百度優化了 FlashMask 動態注意力掩碼,提高了長序列建模能力和訓練效率;
針對大模型的學習效率和幻覺問題,文心 4.5 則繼續在預訓練數據下了苦功夫,通過知識分級採樣、數據壓縮與融合、稀缺知識點定向合成等技術,百度將數據質量大幅提升,模型的質量和成本也都得到了保障;
而對強化學習效率至關重要的后訓練(Post-training)技術,文心 4.5 一樣沒落下,通過融合多種評價方式,百度將一套自反饋迭代式的后訓練技術用到了大模型的后訓練當中,將強化學習的穩定性和魯棒性全面提升,讓模型理解人類意圖的能力更上一層樓。
對標 GPT-4.5,文心 4.5 已經有了相對亮眼的成績;而對標 GPT-o1 和 Deepseek R1 的文心 X1,也交出了一份不錯的答卷。
據了解,百度文心 X1 採取了遞進式的強化學習訓練方法,並且基於思維鏈和行動鏈根據結果反饋進行了端到端的模型訓練,給訓練效果增色不少;而 Deepseek 最引人注目的評估系統,百度在文心 X1 上也做了革新,他們建立了一套同意的評估系統,並將多種類型的獎勵機制融合,讓模型的訓練獲得了更魯棒的反饋。
一系列的努力之下,相比文心 4.0,X1 的文本創作能力顯然更強,也更擅長梳理邏輯、分析複雜問題、生成觀點、提供情緒價值——能和用戶聊「思考深的」,也能聊「感情真的」;
而到了多模態的範疇,文心 X1 也沒丟了系列由來已久的跨模態能力,在圖片理解的精準度更上一層樓,還能細節識別圖片是否有 P 圖痕迹,兼具一副火眼金睛。
相比 Deepseek,剛剛面世的文心 X1 測試下來,在文本的創意和個性化上稍遜一籌。但除了前者所不具備的多模態能力之外,文心 X1 更大的優勢在於「家底厚」——文心大家族支持的「高級搜索」「文檔問答」「AI 繪圖」「TreeMind 樹圖」「百度學術檢索」等等工具,都能在文心 X1 上用到,讓用戶獲得沉浸的一站式 AI 體驗。
在能力上來說,兩款模型在文心 4.0 的基礎上又實現了一次「飛升」;而在成本上,文心 4.5 和 X1 卻再次「跳水」,依靠芯片、模型、框架等層面的聯合優化,文心 4.5 的推理成本只有 GPT-4.5 的 1%,而 X1 的推理成本也只是 Deepseek R1 的一半左右。
成本優勢建立了起來,如何讓用戶更便宜地把大模型用起來,百度就有了底氣:
今天,文心 4.5 和 X1 都已在文心一言官網上線,免費向用戶開放;
面對企業用戶和開發者,文心 4.5 已在百度智能雲千帆大模型平台上,輸入價格為0.004元/千tokens,輸出0.016元/千tokens,約為GPT4.5價格的1%;文心X1定價為輸入0.002元/千tokens,輸出0.008元/千tokens,也即將上線千帆。
百度搜索、文小言等百度的當家產品,也正在逐步接入文心 4.5 和 X1,把最強大的 AI 能力讓社會普惠。
近十年,百度的累計研發投入,已經超過 1800 億,李彥宏在今年 1 月的 25 周年全員信中寫道,很多年裡,百度收入的 20% 以上,都被投入到了研發當中——這麼看,文心 4.5 和 X1 的迭代速度雖然在「意料之外」,但也算是高投入之下的「情理之中」。
然而,這次文心的雙料發佈,卻遠不止是新技術迭代這麼簡單——百度鮮有地放下面子,用誠實的姿態,把自己的優點和缺點暴露在用戶的眼皮底下,究竟圖點什麼?
二、百度變了
像開頭說的一樣,當下這個時點,在 Deepseek 佔領了無數圈內外用戶心智的當口,從市場角度看,百度發佈文心 4.5 和 X1 是一個正確的選擇嗎?
一樣的困境,整整兩年前,在面對 OpenAI 和 ChatGPT 時,百度就已經經歷過了一次。
當時,是李彥宏許久之後首次出席線下會議演講,還是熟悉的白襯衣、熟悉的不緊不慢的語調。甫一開場,他並沒盯着提詞器里的講稿,比起「早有預謀」的台詞,更像有感而發的感嘆,犀利地拋出了一個問題:
「最近一段時間,很多朋友問我:『為什麼是今天,你們真的 ready 了嗎?』」
與其說這個問題問的是別人,不如說,這個問題李彥宏或許也問了自己很多遍。但思前想後,百度不怕被與 OpenAI 比較,也不怕丟面子,有好東西,必須得讓客戶和用戶先用上。
兩年後,文心 4.5 和 X1 發佈,百度更是必須保證更新頻率,缺乏旗艦模型的公司,留在 AI 的第一梯隊也難以服眾。
今天,百度變了,變得不再愛面子:
先前站隊閉源,而 Deepseek 通過開源嘗到了甜頭,那就聞過則喜、從善如流;
Deepseek、Llama 等模型確實各有千秋,那就踐行「拿來主義」、在搜索、地圖、文庫、智能雲等 ToC、To B 產品體系裏海納百川,讓用戶自主選擇;
在未來,智能體和 AI 應用,沒法被一家公司大包大攬,那百度就甘當綠葉,不做「超級應用」,而要幫助人們打造更多「超級有用」的應用;
過去做事慢條斯理、貽誤軍機,今天在內部,文心 4.5 全面免費,PC、移動雙端直接上現貨,等等決策都在半天之內完成,絕不拖泥帶水;
而體現在迭代速度上,百度模型迭代的速度仍在加快,文心 4.5 全部開放之後,最晚 6 月底就將公布開源版本,下半年則有望見到文心 5.0 的面世。
百度變得不愛面子,也變得越來越開放、越來越務實——不躺平,也不苟着。
在今年的「世界政府峰會」WGS 訪談時,李彥宏提到:「我認為創新不能被計劃,你不知道創新何時到來,你所能做的就是營造一個有利於創新的環境。」
枕戈待旦,百度還在謙卑地等着一個機會。但在今天,即使面臨著諸多強敵的挑戰,百度還在大模型的第一梯隊嗎?
三、百度,沒下牌桌
今天,評價所謂「第一梯隊」的 AI 公司,或許還並不能存在一個共識性的標準。
幾個頂流 AI 玩家,更像八仙過海,有些以技術見長,有些重視產品,還有些則乾脆專註市場營銷,各有各的優勢,也各有各的活法。
如果把百度算進第一梯隊的 AI 公司當中,或許有人基於一貫的刻板印象,並不會同意;
然而,數據是直接、有力的,百度在中國的 AI 商業化實踐,的確可以名列前茅——2024年,文心大模型的日均調用量已經達到了 16.5 億次,相比一年前的同期數據,狂增33倍;飛槳平台上,1808 萬個開發者和 43 萬家企業,已經創建了 101 萬個模型;而文心千帆已經幫助客戶完成了 3.3 萬個模型的精調、開發了 77 萬個企業應用。
巨大的 B、C 端使用量,已經幫助百度建立起了一個初具動能的用戶飛輪。同時,每天不停運轉的百度搜索、近億 AI 用戶的百度文庫,以及地圖、網盤等多款億級用戶產品,都是百度內部試驗 AI 效能提升的試驗田,肩負的不僅是百度這家科技公司的技術未來,更是這家上市公司的商業未來。
過去 24 個月里,AI 行業中大的變化,李彥宏說,是「大模型基本消除了幻覺」,這也讓用戶們可以更放心地使用 AI,而不擔心遭到幻覺的反噬——這也是大模型推向商業化的必要條件。
而到了 2025,不同公司的生存策略正逐漸趨同:獨角獸們為了滿足資本的期待,而必須展現自己的盈利能力;而大廠更是如此,要依靠持續不斷的現金業務支撐營收和財報,這樣股價才能有所保障。
而 Deepseek 面世后,看似通過先進的技術力「殺死了比賽」,其實整個 AI 大行業反而有了向好的趨勢。
一方面,Deepseek 的確通過開源,救活了一些基礎模型能力較差的公司和產品,讓他們也能通過接入 Deepseek 的方式,獲得一些流量;
另一方面,Deepseek 在國內突然爆炸式的營銷,讓不少企業單位——尤其是國央企、事業單位——一改之前對 AI 的謹慎態度,紛紛加速擁抱 AI,讓本地部署的一體機生意在近期反而增色不少。
於是,李彥宏在今年的首次內部講話中,他提到,加大 AI 應用商業化實踐同樣相當重要。AI 應用在全行業的爆發,只會加速玩家的淘汰,而那些缺乏商業化能力的公司和產品,恐怕更要遭殃。
早在別人大談 AGI 時,百度就很早提出要在商業化落地上取得成績,要通過 AI 業務給自己造血,絲毫沒有行業「前輩」的「偶像包袱」——翻譯過來就是:「賺錢,不寒摻。」
百度的商業化保證,是其作為一個25年大廠日積月累的龐大矩陣。百度底層有芯片,有智算中心、萬卡集群;中間有模型,有模型精調、APP 開發工具鏈、有大模型商店;頂層有自己的原生 AI 產品,有亟待重構的老牌大 DAU 產品,有豐富的渠道和頗具深度的用戶池子——中間不少要素,即使是同等量級的大廠也難望項背。
今天,百度還帶着兩款技術更先進,免費的文心大模型前來挑戰,而還很少有人知道,百度文心 5.0 的底牌究竟長什麼樣子。
能留在牌桌上,百度的底牌,是它獨特的生態位,是它巨大的體量和它平台型、生態型公司的特點,讓它可以與整個大賽道與有榮焉。
結語
相比兩年前,AI 大模型的賽道,變化其實沒有那麼大。
誠然,技術在日新月異地進步,玩家們來了又走,七百多天里,賽道經歷了百端待舉,也經歷了「群模亂舞」。今天市場重回理性,Deepseek 又強勢入局,頗有一掃六合之勢;Manus 又以智能體作為切口,讓人們對 AI 產生了新的遐想。
但未曾改變的是,AI 的方向仍然被一群人引領着。他們兼具浪漫主義與實幹家精神,技術頭腦與商業眼光,讓他們能夠一直目光如炬,照亮自己,也同樣照亮他人的前路。
今天的百度亦屬於這個行伍,他們是天生的挑戰者,挑戰更強的對手,挑戰更複雜的技術,挑戰昨天的自己。
當心中有夢的時候,面子又算得了什麼呢?
雷峰網 雷峰網