华尔街、美国硅谷正经历的“DeepSeek”风暴并没有结束,DeepSeek R1引发的科技股重挫风波未定,1月28日凌晨,DeepSeek又发布了新的图像生成模型Janus-Pro和JanusFlow。
再出狠招
据财联社报道,北京时间1月28日凌晨,就在美国科技股暴跌之际,DeepSeek工程师们在“抱抱脸”平台上传名为Janus-Pro和JanusFlow的一系列开源多模态模型。这两个模型是对去年10月发布的Janus模型的升级。
根据DeepSeek发布的测试结果,Janus-Pro在 GenEval 和 DPG-Bench 基准测试中击败了 Stable Diffusion 和 OpenAI 的 DALL-E 3。目前,Janus系列的4款模型已经开源。
本次发布的新模型,重点在于文生图能力方面。其中,70亿参数的Janus-Pro-7B在GenEval和DPG-Bench基准测试中,以80%和84.2%的准确率测试结果,击败了OpenAI的DALL-E3和StableDiffusion模型等顶尖的图像生成模型。
据证券时报报道,DeepSeek还在报告中展示了具体的效果。例如,使用“一条金色的寻回犬安详地躺在木质门廊上,周边铺满了秋天的叶子”和“一个有雀斑的年轻女人戴着一顶草帽,站在一片金色的麦田中”,Janus-Pro-7B都能够准确捕捉提示中的语义信息,生成合乎逻辑且连贯的图片。不过,尽管包含大量图像细节,Janus-Pro-7B目前仅支持生成分辨率为384×384的图像。
事实上,DeepSeek一直在多模态领域进行探索。去年,DeepSeek就推出了一种基于自回归的多模态理解与生成统一模型Janus,将视觉编码解耦,以实现多模态理解和生成。进入2025年,公司将Janus进一步升级至Janus-Pro。而在此前接受媒体采访时,当被问及公司在实现通用人工智能的过程中有哪些坐标,梁文锋表示DeepSeek押注了三个方向,一是数学和代码,二是多模态,三是自然语言本身。
图片来源:Hugging Face 官网截图
同样开源、成本低廉
据了解,该项目采用MIT许可证开源,开发者可以通过开源社区GitHub获取完整代码。DeepSeek团队还表示,Janus-Pro的简洁设计和卓越性能,使其有望成为下一代统一多模态模型的重要选择。
值得注意的是,DeepSeek透露,对于1.5B/7B这两个参数的模型,整个训练过程在16/32节点的集群上进行,每个节点配备8块NvidiaA100(40GB)GPU,1.5B/7B模型的训练时间约为7/14天。也就是说,DeepSeek花了两周在256块英伟达A100上,就训练出了击败了OpenAI的DALL-E3和StableDiffusion的模型。
对于DeepSeek团队用低成本成功达成了Open AI一样的成果,一些美国分析师既表示肯定,同时又不约而同的坚持原有的观念。
Raymond James半导体分析师Srini Pajjuri在周一的一份报告中表示:“DeepSeek显然无法获得与美国超大规模企业一样多的计算能力,但设法开发出了一种看似极具竞争力的模型。这可能会在美国超大规模企业中引发更大的紧迫感。”不过他认为,这些巨头公司可以利用其掌握大量GPU的优势,使自己与DeepSeek这类更便宜的选择区分开来。
花旗分析师认为,DeepSeek发布后,把针对计算成本的讨论上升为一个“关键话题”。但他们表示,美国科技公司不会放弃对先进芯片的拥有,美国政府宣布投入5000亿美元的“星际之门”AI基础设施项目也重申了对先进芯片需求的认可。
图片来源:DeepSeek 官网截图
来自英伟达、白宫的评价
尽管国产大模型公司DeepSeek使得AI芯片龙头英伟达股价暴跌,但英伟达依然给出高度评价。当地时间1月27日,英伟达发言人表示:“DeepSeek是AI领域的一项卓越进步,也是测试时间缩放(Test Time Scaling)技术的完美范例。DeepSeek的工作展示了如何利用这种技术、广泛可用的模型以及完全符合出口管制的计算资源来创建新型号。”
据证券时报报道,白宫人工智能和加密货币总管David Sacks在X上发帖称,DeepSeek R1的表现显示人工智能竞争将非常激烈, “我对美国充满信心,但我们不能自满”。
DeepSeek冲击市场
DeepSeek大模型引发市场对AI前景的空前辩论。对于芯片巨头英伟达而言,成为了历史上的“至暗时刻”,周一美股英伟达大跌16.97%。
而周一A股中WindDeepSeek合作商指数则大涨10.96%,成分股每日互动、卓创资讯都20%封住涨停,拓尔思、并行科技、飞利信等多只个股涨幅超过10%。
本文转自“Wind万得”微信公众号,FOREXBNB编辑:刘璇