FOREXBNB获悉,世界首富、特斯拉CEO以及AI独角兽xAI的创始人与掌舵者伊隆·马斯克(Elon Musk)在周二向全球展示了最新迭代的Grok-3 人工智能大模型,这位亿万富翁称其为“地球上最聪明的AI”,在上周被马斯克本人冠以所谓的“骇人智能系统”(Scary Smart)美誉。
Grok-3向全球震撼发布之后,市场掀起关于“Grok-3最大受益者”的热议,目前来看多数投资者认为特斯拉FSD(全自动驾驶系统),以及特斯拉正在加大力度推进的人形机器人擎天柱(即Optimus),可能是最大赢家,其次则是在Grok-3发布会上被Grok AI聊天机器人揭秘SpaceX宏大计划的太空探索领域独角兽SpaceX。Grok-3在发布会上展现出了极其强大的推理能力、逻辑应变能力、理解极度复杂物理知识以及空间模拟能力,而这些能力对于FSD与Optimus的“人工智能大脑”综合反应能力提升而言至关重要。
xAI在周二的这一场Grok-3 AI大模型直播发布会中表示,Grok-3在数学、科学和编程基准测试中击败了谷歌Gemini大模型、DeepSeek-V3、Anthropic旗下的旗舰大模型Claude,以及OpenAI的旗舰大模型GPT-4o。马斯克与三名xAI工程师共同演示时强调,Grok-3 大模型的综合计算能力是前代Grok-2综合性能的“10倍以上”,并于1月初完成预训练。
发布会上的性能对比图还显示,Grok-3 所推出类似的DeepSeek-R1的DeepSearch深度推理型聊天机器人,在数学、科学和编程基准测试中击败o3mini的high高级版本以及DeepSeek-R1,这三项能力均位列主流推理型人工智能大模型中的最强性能。
“我们每天都在改进大模型,实际上在你所使用的24小时内你就能看到我们连续不断地进步。”马斯克在直播中表示。
xAI在发布Grok-3大模型的同时,也推出了名为“深度搜索(DeepSearch)”的深度推理型人工智能聊天机器人。直播中的演示显示,DeepSearch是一款推理型的聊天机器人,像DeepSeek-R1那样像用户们展示其理解问题并规划答案的全部过程,并且在直播中展示出强大的推理与空间模拟能力,支持前沿研究、头脑风暴和数据分析等需要消耗庞大AI算力的人工智能功能。马斯克团队还表示将“尽快”推出基于语音聊天模式的AI聊天机器人。
马斯克与发布会上的三位工程师表示,Grok-3将立即向社交媒体X平台的Premium+订阅用户开放。这家被马斯克私人所有的社交媒体公司(前身为推特),还在为智能手机移动端应用程序和Grok.com网站推出名为“超级Grok(SuperGrok)”的新订阅服务。
更重要的是,崇尚“开源文化”的马圣(即马斯克)表示,xAI计划在Grok-3完全成熟后开源此前的所有Grok 人工智能大模型版本,马斯克预计Grok-3的这一最新迭代过渡进程将在几个月内完成。
“马斯克vs OpenAI”的篇章未完待读
马斯克关于Grok-3 综合性能的声明——目前尚未经第三方系统的正式验证,加剧了其人工智能领域最强初创公司OpenAI以及一众AI初创公司的激烈竞争。他于2023年创立xAI,旨在全面击败ChatGPT的开发商OpenAI,力争成为ChatGPT的替代AI聊天机器人,并公开批评后者转向营利性业务的计划完全背离他与阿尔特曼等人创立OpenAI的开源初衷。
这位亿万富翁以“背离创立初心”为由两次起诉OpenAI,并提出以974亿美元收购OpenAI的非营利分支——在上周被阿尔特曼以及OpenAI董事会拒绝。OpenAI首席执行官山姆·阿尔特曼称此举是“拖延OpenAI的发展策略”。马斯克曾参与OpenAI创立,但自2018年退出董事会后一直对其持批评态度。
“OpenAI本应是开源、非营利性质的,现在他们转变为‘封闭、最大化盈利的AI’,他们完全是在追求‘下一层次’的更高利润。”这位世界首富在上周迪拜世界政府峰会通过视频对全球听众们说道。
马斯克和人工智能行业领军者OpenAI的首席执行官山姆·阿尔特曼之间可谓长期存在敌意,主要源于马斯克担心OpenAI正在偏离其非营利的创立原则。马斯克通过自己的人工智能初创公司xAI与OpenAI竞争,并曾起诉该公司,指控其优先追求利润而非人类福祉,从而违反了其创立的使命与“非营利”的创立原则,这也是为何马斯克创办xAI并且力争超越OpenAI成为全球“开源人工智能”的领导者,而不是像OpenAI那样执着于“Close闭源策略”。
据了解,xAI的Grok-1模型已于2024年3月17日开源,遵循Apache 2.0许可证,允许用户自由使用、修改和分发部署。在当时,xAI宣布在Apache 2.0许可证下开源其3140亿参数的混合专家(MoE)模型Grok-1,包括模型的权重和架构,这使得Grok-1成为截至2024年3月为止参数量最大的开源AI大语言模型。开发者和研究人员可以在GitHub上获取Grok-1的代码和模型权重。
OpenAI和xAI等AI巨头正以飙升的估值快速融资。据彭博社上周报道,xAI正洽谈以约750亿美元估值融资100亿美元,PitchBook数据显示其上一轮融资估值约为510亿美元。OpenAI则正在寻求以高达3000亿美元的估值融资400亿美元。
人工智能领域,尤其是AI大模型高效率运行背后所需的庞大数据中心基础设施,可谓极度资本密集。软银、OpenAI、甲骨文和阿布扎比所支持的MGX于1月联合宣布投入1000亿美元,最终投资目标大约5000亿美元,建设美国超大型AI数据中心,该AI基础设施项目名为“星际之门”。
DeepSeek-R1横空出世,美国AI领域陷入恐慌
但对于这些美国人工智能初创公司,以及微软、谷歌以及英伟达等“美国七大科技巨头”来说,颇具挑战性的人工智能技术正在出现。上月,来自中国AI初创公司DeepSeek1月份重磅发布开源大模型DeepSeek-R1,在多项基准测试中持平或超越美国头部人工智能负面性竞品,且研发成本仅为后者的零头。
虽然训练/推理成本相比于GPT家族以及LIama开源大模型骤降,但是DeepSeek大模型的多个性能指标却位于行业顶尖水平。性能评估结果显示,通过纯强化学习方法训练得到的 DeepSeek-R1-Zero以及在此基础上改进的 DeepSeek-R1,在 2024 年AIME(美国数学邀请赛)测试中分别取得了 71.0% 和 79.8% 的成绩,与 OpenAI o1 的79.2%水平可谓并驾齐驱。DeepSeek-R1在算法类代码场景(Codeforces)以及GPQA、MMLU中的最终得分略低于OpenAI o1,但是在评估AI大模型在解决实际软件工程问题能力的SWE-Bench Verified方面,意外强于o1。
在不到600万美元的极低投入成本和2048块性能远低于H100与Blackwell的H800芯片条件下,DeepSeek团队打造出性能堪比OpenAI o1的开源AI模型,相比之下Anthropic与OpenAI训练成本高达10亿美元,DeepSeek的推理输入与输出token定价相比于OpenAI定价则可谓“骨折级”促销。DeepSeek每百万输出token仅需2.19美元,而OpenAI的GPT-4高达60美元。
DeepSeek 的低成本+超高效+不输于o1的大模型综合性能,源于对大模型训练流程的每个环节都施加了“极致工程”与“精细微调”,同时引入纯强化学习,而非传统的基于大量示例的监督学习(SFT),大幅降低大模型训练/推理成本。
以极致工程为导向的高效训练与数据压缩策略,通过多层注意力(MLA)——尤其对Query端进行低秩化,从而在训练时减少激活内存负担;还包括FP8混合精度训练、DualPipe 并行通信、MoE负载均衡等手段,让DeepSeek在训练阶段将硬件资源利用率最大化,减少“不必要的算力浪费”,以及“强化学习(即RL)+蒸馏+专业数据优化”等创新型AI训练举措,打造出“极致压缩+高效强化训练+AI推理算力架构大幅简化”的低成本AI算力新范式。
DeepSeek 公司展现出如何在有限AI GPU 资源下逼近乃至超越行业主流大模型性能,对传统“巨额烧钱”模式提出了强力挑战。在业内人士看来,DeepSeek将硬件和算法的潜能最大化挖掘——这与过去很长一段时间美国科技大厂们“粗放式烧钱”在某种程度上形成鲜明对比。
DeepSeek-R1横空出世以来,“七大科技巨头”领涨美股的逻辑发生了根本性质的变化,投资者们开始强烈质疑美国科技巨头们对于人工智能堪称狂热的AI烧钱计划是否合理。除了Meta,其他巨头的股价表现都大幅跑输标普500指数,成为拖累整个美股上涨的最核心负面催化剂。
Grok-3 横空出世,特斯拉FSD与Optimus发展进程迎来助攻
马斯克本人创立并领导的xAI所推出的Grok-3 大模型,未来或将与马斯克所领导的特斯拉人工智能超算体系进行深度融合。
随着DeepSeek引领的“低成本算力新范式席卷全球”,AI训练与应用推理端AI成本愈发下行,同时全面驱动AI应用软件(尤其是生成式AI软件与AI代理)向全球各行各业加速渗透,彻底革新各业务场景的效率并大幅提高销售额。
Meta、SAP、Palantir、AppLovin、阿里巴巴以及腾讯等软件巨头AI创收数据与利润或将迎来指数级别增长,它们或将是DeepSeek全球爆火,以及“DeepSeek低算力成本冲击波”之下的最大赢家,而特斯拉作为全球少有的软件与硬件一体化平台领军者,自然将大幅受益于性能不断提升的AI大模型融入FSD与Optimus。
特斯拉基于AI超算体系所打造的FSD,有了Grok-3的接入相当于“大脑迎来智力等级提升”,对于需要在极短时间内根据视觉场景做出极速推理能力的Optimus来说也可谓是强劲催化剂。
Grok‑3大模型主要聚焦于强大自然语言理解以及当前大模型领域最强大的推理能力、空间模拟能力,以及基于物理世界进行全方位动态化模拟与仿真的能力。
而特斯拉的AI超算体系,以及Optimus人形机器人的视觉-行为大模型,则在实时数据处理、快速反应与决策、传感器融合及自动驾驶场景中具备极高的算力和低延迟能力。两者如果进行深度融合,能够在理论上实现信息处理从语义理解、动态视觉到高效率实时决策的端到端极速智能化。
融合后人工智能超级推理系统将具备同时高效处理多个任务的能力,例如在自动驾驶中同时实现极速路径规划、障碍物检测以及车内语音交互,Grok‑3配合特斯拉超算体系的低延迟与并行处理优势,构建起一个能够即时理解、分析和执行极度复杂场景任务的自动驾驶系统;在Optimus人形机器人上,则可以同时进行高效率环境感知的同时极速进行决策、语音交互与仿人类物理操作,提升人形机器人自主性,在多场景中将能够表现出卓越的协同操作能力。