根据FOREXBNB的消息,Anthropic公司开发了一款融合了推理功能的混合型人工智能模型。这家由亚马逊和Alphabet支持的公司采取了一种独特的推理策略,其模型在解决复杂问题时会消耗更多的计算资源。同时,该人工智能模型也能像传统的大型语言模型一样,在无需额外操作的情况下快速处理较为简单的任务。据报道称,Anthropic计划在接下来的几周内对外发布这款新模型。
Anthropic的这款新混合模型允许用户自行决定在一个问题上投入多少计算资源,即对问题的“推理”时间。报告中提到,开发者可以通过调整滑动条的比例来控制这一数量,模型在预测答案时会根据令牌或字符的数量进行处理或生成。
如果将滑动条调至“0”,开发者可以将模型用作一个通用的、不包含推理功能的人工智能,与微软支持的OpenAI的GPT-4o相似。OpenAI也提供了类似的功能,允许开发者控制其推理模型的“思考”时间。开发者可以设置三种不同的设置:低、中、高。但是,很难预测模型在每个级别上实际消耗的令牌数量,从而无法准确预测单个查询的耗时。
在周三的报道中提到,OpenAI计划在未来几周内发布其最新的大型语言模型ChatGPT-4.5,并计划在未来几个月内推出GPT-5。该公司打算将现有的模型整合到GPT-5中。
OpenAI和Anthropic在人工智能市场的定位似乎有所不同。OpenAI的目标是将ChatGPT打造成面向消费者或个人专业人士的突破性应用,而Anthropic则计划更多地关注企业市场,这也是为什么它正在开发一些功能,以便开发者在成本、速度和定价方面有更多的控制权。
Anthropic的新模型在编码领域同样表现出色。例如,当模型被允许进行最长时间的“思考”时,它在某些编程基准测试中的表现超过了用户目前使用的最先进的OpenAI推理模型(即将推理设置为“高”的o3-mini模型)。
OpenAI的推理模型更擅长处理学术问题,例如竞争性编程问题,而Anthropic的模型则更精通于企业工程师可能会进行的编码任务。报告补充说,Anthropic的模型更擅长理解由数千个文件构成的复杂代码库,并能生成能够一次运行成功的完整代码行。
然而,Anthropic的新模型的具体成本,以及它是否比OpenAI最近推出的o3-mini推理模型更经济,目前还不得而知。报道指出,该模型的成本低于OpenAI广受欢迎的非推理模型GPT-4o,后者给开发者留下了深刻印象。
目前尚不清楚,像DeepSeek和谷歌新推出的Gemini这样的经济型人工智能是否会将所有模型的定价压低至接近零。据报道,谷歌计划向Anthropic追加投资10亿美元。
本月早些时候,OpenAI在ChatGPT中推出了一项名为“深度研究”的新功能,这是一种代理能力,可以在互联网上为复杂任务进行多步骤研究。深度研究由o3模型的一个版本提供支持,该模型针对网页浏览和数据分析进行了优化。上个月,OpenAI推出了其首款名为Operator的人工智能代理,旨在帮助用户完成各种购物任务。