OpenAI的GPT系列身後,國產大模型正緊追不捨。

1月20日,DeepSeek正式發布DeepSeek-R1,並同步開源模型權重。據介紹,DeepSeek-R1在後訓練階段大規模使用了強化學習技術,在僅有極少標註數據的情況下,極大提升了模型推理能力。在數學、程式碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。

根據其公佈的測試數據,DeepSeek-R1在美國AIME 2024、MATH-500和SWE-bench Verified測驗中的比分均高於OpenAI o1(小K註:前两个测试专註于数学能力,SWE-bench Verified旨在評估AI模型解決現實世界軟體問題的能力)。

國產AI“三榮”戰OpenAI:DeepSeek、月之暗面、MiniMax相繼上新 戰况如何? - 圖片1

同一天,Kimi全新SOTA模型——k1.5多模態思考模型上線。在long-CoT模式下,Kimi k1.5的數學、程式碼、多模態推理能力,也達到長思考SOTA模型OpenAI o1正式版的水平。官方表示,這應該是全球範圍內,OpenAI以外的公司首次實現o1正式版的多模態推理性能。Kimi技術團隊第一次準備了詳細的技術報告。

在short-CoT模式下,Kimi k1.5的數學、程式碼、視覺多模態與通用能力,大幅超越了全球範圍內短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,領先達到550%。

國產AI“三榮”戰OpenAI:DeepSeek、月之暗面、MiniMax相繼上新 戰况如何? - 圖片2

國產AI“三榮”戰OpenAI:DeepSeek、月之暗面、MiniMax相繼上新 戰况如何? - 圖片3

其他國產大模型同樣表現出色,1月15日,MiniMax發布全新開源模型系列Minimax-01,在多個標準和內部基準測試中,Minimax-01的性能與GPT-4o、Claude3.5-Sonnet等頂尖模型相當,尤其在長上下文處理方面表現突出。

OpenAI分別在2024年5月、9月亮盤12月發布了GPT-4o、GPT-o1(包括o1-preview和o1-mini,o1正式版延後到2024年12月發布)和GPT-o3,目前最強大的模型是o3,具備優秀的推理能力、科學知識掌握更優秀、編碼能力更強。

o1緊隨其後,擅長編碼、數學和寫作,其多模態功能支援圖片上傳,允許它將推理應用於視覺,以獲得更詳細、更有用的回复。

以DeepSeek為代表的國產大模型團隊力圖在性能上比肩最先進的大模型,定價則展示了極致性價比。

DeepSeek-R1 API服務定價為每百萬輸入tokens 1元(緩存命中)/4元(快取未命中);每百萬輸出tokens 16元。

與之對比,GPT-o1模型每百萬輸入tokens 15美元(約合人民幣110元);每百萬輸出tokens 60美元(約合人民幣438元)。OpenAI目前最便宜的模型是GPT-4o mini,其定價為每百萬輸入Tokens 10美元(約合人民幣73元);每百萬輸出tokens 20美元(約合人民幣146元)。

國產大模型呼喚國產算力

國內外大模型廠商你追我趕,短時間內迅速迭代,意味著大模型廠商對算力的需求仍在持續增加。

火山引擎智慧演算法負責人吳迪先前曾表示,位元組跳動綜合考量算力資源儲備、市場未來用量、模型成本下降等因素判斷,2027年豆包每天Token消耗量會超過100兆,將是現在的100倍以上。

1月20日消息稱,據蕪湖市生態環境局官網,位元組跳動(抖音集團)旗下蕪湖江東名邑科技有限公司擬在安徽蕪湖建設火山引擎長三角算力中心項目,項目環境影響評估文件近日獲受理,並正在實施批前公示。該項目總投資80億元,設計伺服器機櫃數為21824台,網路機櫃236台,一座220kV變電站。

此前有消息稱,小米正在搭建自己的GPU萬卡集群,並對AI大模型進行大規模投資。

東莞證券先前表示,未來,隨著位元組、幻方、小米等國內廠商積極佈局AI領域,國產大模型可望快速崛起,推動國產算力需求成長,促進國產算力基礎建設,我國國產算力產業鏈可望迎來發展機遇。

上海證券也發布研報稱,以位元組為代表的國產大模型崛起,以及小米等玩家的入局,預計將拉動國內網路大廠在算力端的支出,國內算力軍備競賽剛開始,國產算力廠商迎來發展機遇。

東方證券表示,算力建設持續性至關重要,在此背景下,伺服器及液冷廠商、PCB廠商等有望受益。另外,資料存力和運力需求的持續攀升,為儲存、光模組和光晶片等企業創造了更多的市場機會,促使整個產業鏈不斷優化升級,以滿足日益增長的AI算力需求。

本文轉載自“財聯社”,FOREXBNB編輯:劉璇。