根据FOREXBNB的报道,DeepSeek公司宣布,他们今天发布了DeepEP,这是首个针对MoE模型训练和推理的开源EP通信库。该库具备以下特性:高效的全员沟通优化;支持NVLink和RDMA的节点内和节点间通信;为训练和推理预填充设计的高吞吐量核心;为推理解码设计的低延迟核心;原生支持FP8调度;以及灵活的GPU资源管理,以实现计算与通信的重叠。
2月24日,DeepSeek公司启动了“开源周”,并发布了首个代码库FlashMLA。在此之前,2月21日,DeepSeek在社交媒体上宣布,他们已经组建了一支致力于探索AGI(通用人工智能)的团队,并计划开源5个代码库,以完全透明的方式分享他们的研究成果。