根據FOREXBNB的報導,2月11日,著名的音視頻服務提供商七牛雲(02567)宣布了DeepSeek-R1蒸餾版模型的上線。結合2月7日發布的信息,七牛雲已經推出了專門適配DeepSeek-V3/R1全系列模型的GPU雲主機和Token API推理服務。七牛雲旨在通過其一站式AI推理解決方案來滿足客戶對生成式AI日益增長的需求,並提供了兩種模型部署方式:一種是通過API接口快速集成,另一種是一鍵部署高性能GPU雲服務器。
為了減少從概念到產品的距離,七牛雲希望開發者能夠在自己的應用中集成與官方版DeepSeek-R1相媲美的頂級推理能力,首先推出了全參數的DeepSeek-R1 671b全參模型。作為開源模型,DeepSeek-R1的效果與海外巨頭的閉源模型相媲美,在推理效率、場景適配等多個方面樹立了新的標準。因此,七牛雲提供了最完整效果和最具成本效益的1.73bit量化DeepSeek-R1 671b全參版本,將顯存需求大幅降低至158GB,並能在A100、V100、A10等高性價比GPU服務器上實現快速推理。
同時,為了滿足不同開發者的個性化需求,七牛雲迅速推出了DeepSeek-R1蒸餾版模型。這些模型經過優化,具有輕量化和高效推理的特點,能夠在計算資源有限的設備上運行,特別適合中小企業和開發者部署,以低成本應用到實際業務中。為了幫助開發者,七牛雲提供了與不同蒸餾模型相匹配的GPU主機配置建議,並提供了一鍵部署方式,確保開發者可以根據自己的需求快速選擇配置,啟動和運行模型。