根據FOREXBNB的報導,DeepSeek公司宣布,他們今天發布了DeepEP,這是首個針對MoE模型訓練和推理的開源EP通信庫。該庫具備以下特性:高效的全員溝通優化;支持NVLink和RDMA的節點內和節點間通信;為訓練和推理預填充設計的高吞吐量核心;為推理解碼設計的低延遲核心;原生支持FP8調度;以及靈活的GPU資源管理,以實現計算與通信的重疊。
2月24日,DeepSeek公司啟動了“開源週”,並發布了首個代碼庫FlashMLA。在此之前,2月21日,DeepSeek在社交媒體上宣布,他們已經組建了一支致力於探索AGI(通用人工智能)的團隊,併計劃開源5個代碼庫,以完全透明的方式分享他們的研究成果。