根據FOREXBNB的消息,Anthropic公司開發了一款融合了推理功能的混合型人工智能模型。這家由亞馬遜和Alphabet支持的公司採取了一種獨特的推理策略,其模型在解決複雜問題時會消耗更多的計算資源。同時,該人工智能模型也能像傳統的大型語言模型一樣,在無需額外操作的情況下快速處理較為簡單的任務。據報導稱,Anthropic計劃在接下來的幾週內對外發布這款新模型。
Anthropic的這款新混合模型允許用戶自行決定在一個問題上投入多少計算資源,即對問題的“推理”時間。報告中提到,開發者可以通過調整滑動條的比例來控制這一數量,模型在預測答案時會根據令牌或字符的數量進行處理或生成。
如果將滑動條調至“0”,開發者可以將模型用作一個通用的、不包含推理功能的人工智能,與微軟支持的OpenAI的GPT-4o相似。OpenAI也提供了類似的功能,允許開發者控制其推理模型的“思考”時間。開發者可以設置三種不同的設置:低、中、高。但是,很難預測模型在每個級別上實際消耗的令牌數量,從而無法準確預測單個查詢的耗時。
在周三的報導中提到,OpenAI計劃在未來幾週內發布其最新的大型語言模型ChatGPT-4.5,併計劃在未來幾個月內推出GPT-5。該公司打算將現有的模型整合到GPT-5中。
OpenAI和Anthropic在人工智能市場的定位似乎有所不同。OpenAI的目標是將ChatGPT打造成面向消費者或個人專業人士的突破性應用,而Anthropic則計劃更多地關注企業市場,這也是為什麼它正在開發一些功能,以便開發者在成本、速度和定價方面有更多的控制權。
Anthropic的新模型在編碼領域同樣表現出色。例如,當模型被允許進行最長時間的“思考”時,它在某些編程基準測試中的表現超過了用戶目前使用的最先進的OpenAI推理模型(即將推理設置為“高”的o3-mini模型)。
OpenAI的推理模型更擅長處理學術問題,例如競爭性編程問題,而Anthropic的模型則更精通於企業工程師可能會進行的編碼任務。報告補充說,Anthropic的模型更擅長理解由數千個文件構成的複雜代碼庫,並能生成能夠一次運行成功的完整代碼行。
然而,Anthropic的新模型的具體成本,以及它是否比OpenAI最近推出的o3-mini推理模型更經濟,目前還不得而知。報導指出,該模型的成本低於OpenAI廣受歡迎的非推理模型GPT-4o,後者給開發者留下了深刻印象。
目前尚不清楚,像DeepSeek和谷歌新推出的Gemini這樣的經濟型人工智能是否會將所有模型的定價壓低至接近零。據報導,谷歌計劃向Anthropic追加投資10億美元。
本月早些時候,OpenAI在ChatGPT中推出了一項名為“深度研究”的新功能,這是一種代理能力,可以在互聯網上為複雜任務進行多步驟研究。深度研究由o3模型的一個版本提供支持,該模型針對網頁瀏覽和數據分析進行了優化。上個月,OpenAI推出了其首款名為Operator的人工智能代理,旨在幫助用戶完成各種購物任務。