3月1日,DeepSeek公司發布了兩則重要消息,一方面展示了其V3/R1推理系統在技術與成本上的優勢,另一方面則面臨商業模式的挑戰。
DeepSeek理論利潤率披露
DeepSeek在知乎平台發布技術文章《DeepSeek-V3/R1推理系統概覽》,首次披露其V3/R1推理系統的理論成本利潤率高達545%。文章指出,該系統通過大規模跨節點專家並行(EP)方案,優化了吞吐量和延遲,提升了性能。具體技術手段包括增長批量大小、隱藏傳輸耗時和負載均衡。
模型 | 訓練成本(萬美元) | 推理成本(元/百萬token) | 理論利潤率(%) |
---|---|---|---|
DeepSeek-V3/R1 | 557.6 | 16 | 545 |
OpenAI GPT-4o | >1000 | >50 | 未披露 |
潞晨科技暫停DeepSeek API服務
潞晨科技宣布將暫停DeepSeek API服務,要求用戶盡快使用賬戶餘額,未使用部分將全額退款。潞晨科技CEO尤洋對DeepSeek公佈的理論成本利潤率提出質疑,主要爭議點包括:
- 數據參考性問題:合併計算DeepSeek網頁、APP和MaaS API的token數,無法準確反映MaaS的真實成本和使用情況。
- MaaS性能與穩定性:春節期間DeepSeek APP和網頁頻繁掉線,延遲高達15分鐘以上,無法滿足ToB客戶對低延遲和高穩定性的要求。
- 商業模式可持續性:MaaS需時刻保持超負荷運轉,且需準備5倍於實際需求的機器資源以應對突發流量,導致成本高企。
- 技術創新的實際貢獻:DeepSeek在AI基礎設施上依賴英偉達GPU和已有技術,並未提出顛覆性算法,技術優勢未能轉化為商業成功。