3月1日,DeepSeek公司发布了两则重要消息,一方面展示了其V3/R1推理系统在技术与成本上的优势,另一方面则面临商业模式的挑战。
DeepSeek理论利润率披露
DeepSeek在知乎平台发布技术文章《DeepSeek-V3/R1推理系统概览》,首次披露其V3/R1推理系统的理论成本利润率高达545%。文章指出,该系统通过大规模跨节点专家并行(EP)方案,优化了吞吐量和延迟,提升了性能。具体技术手段包括增长批量大小、隐藏传输耗时和负载均衡。
模型 | 训练成本(万美元) | 推理成本(元/百万token) | 理论利润率(%) |
---|---|---|---|
DeepSeek-V3/R1 | 557.6 | 16 | 545 |
OpenAI GPT-4o | >1000 | >50 | 未披露 |
潞晨科技暂停DeepSeek API服务
潞晨科技宣布将暂停DeepSeek API服务,要求用户尽快使用账户余额,未使用部分将全额退款。潞晨科技CEO尤洋对DeepSeek公布的理论成本利润率提出质疑,主要争议点包括:
- 数据参考性问题:合并计算DeepSeek网页、APP和MaaS API的token数,无法准确反映MaaS的真实成本和使用情况。
- MaaS性能与稳定性:春节期间DeepSeek APP和网页频繁掉线,延迟高达15分钟以上,无法满足ToB客户对低延迟和高稳定性的要求。
- 商业模式可持续性:MaaS需时刻保持超负荷运转,且需准备5倍于实际需求的机器资源以应对突发流量,导致成本高企。
- 技术创新的实际贡献:DeepSeek在AI基础设施上依赖英伟达GPU和已有技术,并未提出颠覆性算法,技术优势未能转化为商业成功。