根据FOREXBNB的报道,上星期五(1月17日),OpenAI的CEO山姆·奥特曼在社交媒体平台X上宣布,公司已经完成了其最新的推理AI模型o3 mini的版本更新,并计划在未来几周内对外发布。此前在2023年12月底,OpenAI曾透露,在特定条件下,o3模型有望接近实现AGI(通用人工智能)。

在2024年9月,OpenAI推出了o1推理AI模型,该模型通过延长处理查询的时间,能够处理更加复杂的问题。据称,o1模型在科学、编程和数学等领域能够处理更具挑战性的问题。与GPT等旧版模型相比,o1模型不仅仅是一次简单的升级,而是代表了“全新的游戏规则”和“真正的进步”。OpenAI的研究副总裁Mark Chen曾表示,o1与标准的ChatGPT有着本质的区别,因为它具备“推理”能力,这是人类智能的一个标志。

随着o1模型的发布,去年国内市场也出现了一批新兴的大型模型,包括kimi的k0math、幻方量化的Deepseek的DeepSeek-R1-Lite以及昆仑万维的“天工大模型4.0”o1版。月之暗面先后推出了数学模型k0-math和升级版的视觉思考模型k1,在数理化等特定领域的表现超过了o1。得益于成本的降低和模型的进化,AI应用也开始大量涌现。ChatGPT风格的AI对话助手成为了各家的“标配”,包括字节豆包、月之暗面Kimi、腾讯元宝等。

即将发布的o3和o3 mini模型预计将比o1系列更加强大。OpenAI的发言人曾表示,在命名这款新模型时,他们决定跳过o2,这是出于对英国电信公司O2的尊重。

据悉,o3模型在ARC-AGI基准测试中取得了创纪录的分数。ARC-AGI由Keras的创始人François Chollet开发,主要通过图形逻辑推理来测试模型的推理能力。在满分为100%的ARC-AGI评估中,o3在低计算场景下得分为75.7%,在高计算测试中得分为87.5%。o3的最佳成绩超过了代表达到人类水平的85%的门槛。相比之下,o1模型的得分仅在25%到32%之间。此外,在衡量编程能力的Codeforces Elo评分中,o3获得了2727的Elo评分,而o1的评分仅为1891。

国金证券预测,未来随着大模型使用成本的持续下降和中文语言模型能力的不断提升,落地应用有望加速。中国企业凭借文化基础、数据积累、场景理解、工程应用和客情关系等优势,有机会成为产业的领导者。

中信证券表示,观察2025年全球科技市场投资,从市场角度来看,中国科技资产相对于美国资产具有更高的投资性价比。在中国科技板块中,中概互联网板块被视为首选,关注短期宏观复苏和政策刺激为板块带来的业绩拐点,以及中长期AI生态的持续繁荣为板块带来的估值重塑机会,并看好中国国产AI产业链的投资机会。

相关概念股:

百度集团-SW(09888):在模型方面,百度的文心大模型矩阵包括ERNIE 4.0 Turbo等旗舰大模型、ERNIE Speed等轻量模型,以及基于基础模型生产的系列思考模型和场景模型。根据百度披露的数据,文心大模型的日均调用量超过15亿,相比一年前增长了约30倍,用户规模达到4.3亿。在产品方面,据官方数据,截至去年9月,文小言的月活跃用户达到千万级别,累计调用量超过20亿次。

阿里巴巴-SW(09988):阿里云在去年5月初发布的通义千问2.5,得分已经追平GPT-4 Turbo。目前,阿里已经投资了Minimax、月之暗面、零一万物、智谱AI、百川智能等国内主流的大模型创业公司。

商汤-W(00020):国内权威大模型测评机构SuperCLUE发布的《中文大模型基准测评2024年度报告》中,商汤的“日日新”融合大模型以总分68.3的优异成绩,与DeepSeek V3并列国内榜首,成为年度第一。在近期另一个权威综合评测机构OpenCompass的多模态评测中,商汤以同一款模型同样取得了榜单第一,分数大幅领先GPT-4o。