Google(GOOGL.US)發布新世代AI模型Gemini 2.0 Flash

2024-12-12 08:41

據FOREXBNB報道，Google(GOOGL.US)於本週三推出了人工智慧模型Gemini 2.0系列的首個版本——Gemini 2.0 Flash。此版本包含聊天功能，全球用戶開放，同時支援文字轉語音的轉換。

FOREXBNB獲悉，週三，Google(GOOGL.US)發布了Gemini 2.0系列人工智慧模型的第一個版本。該模型被稱為Gemini 2.0 Flash，其聊天版本可供全球用戶使用，而具有文字轉語音和圖像生成功能的實驗多模式版本則可供開發人員使用。

Google表示，這是他們迄今為止最強大的人工智慧模型，“專為智能體時代設計”，並同時介紹了多個智能體應用(AI Agent)。對於Gemini 2.0模型，Google表示会先将开放给开发者以及受信任的测试人员，並將其整合到產品中。Gemini 2.0基於Google定制的硬體第六代TPUTrillium構建而成。Google表示，TPU為Gemini2.0的訓練和推理提供100%算力支持。

谷歌執行長Sundar Pichai在一份聲明中表示：“如果說Gemini 1.0是關於組織和理解訊息，那麼Gemini 2.0是關於讓資訊變得更有用。”

目前谷歌完全對外開放的新模型是Gemini 2.0 Flash體驗版，這是谷歌的主力模型，具有低延遲特性。與先前的1.5 Flash版本相比，Gemini 2.0 Flash在同樣快速的反應時間下效能進一步增強。谷歌提到，2.0 Flash在關鍵基準測試中甚至超越了先前的旗艦模型1.5 Pro，其速度是1.5 Pro 的兩倍。

同時Gemini 2.0 Flash還具有新功能，除了能夠支持圖片、視訊和音訊等多模態輸入，Gemini 2.0 Flash可以支援多模態輸出，例如可以直接產生圖像與文字混合的內容，以及原生生成可控的多語言文字轉語音(TTS)音訊。它還可以原生調用Google Search、程式碼執行以及第三方使用者定義的函數等工具。

作為提供給開發者的體驗版模型，Gemini 2.0 Flash 現在可以透過Google AI Studio和Vertex AI中的Gemini API獲取，所有開發者均可使用多模態輸入和文字輸出。該產品將於明年1月全面上市，谷歌稱屆時將推出更多型號。

Gemini 2.0系列模型代表了Google在科技業競爭日益激烈的人工智慧競賽中的最新努力。其競爭對手包括微軟(MSFT.US)和Meta(META.US)，以及OpenAI等新創公司。

值得注意的是，除了最新發布的Gemini 2.0 Flash，在發布產品的同時，Sundar Pichai在X上著重提到了智能體Project Astra，認為其“展示了通用AI助手的曙光”。

據悉，Project Astra是谷歌最初在5月的I/O大會上首次對外發布的AI助理，彼時主要是對標OpenAI的GPT-4o，其主要功能包括即時語音和視覺處理，能夠透過手機或谷歌眼鏡進行跨文本、音訊、影片的多模態即時推理。谷歌在此次的部落格中稱之為“使用多模態理解現實世界的智能體”。

對於此次正式發布的Project Astra，Google表示，它能夠流暢地在多種語言和混合語言之間進行對話，並且能夠理解不同口音和生僻單詞。另外，借助Gemini 2.0，Project Astra可以使Google Search、Google Lens和Google Maps，從而在日常生活中發揮助手的作用。

谷歌增強了Project Astra的記憶能力，這一助手目前可以記住長達 10 分鐘的會話內容，並且可以回想起過去與它進行的更多對話，能提供個人化服務。

Google表示，AI智能體在現實中的應用是一個令人振奮且充滿可能性的研究領域，團隊正在探索這個全新的領域，並開發出了一系列原型，幫助人們完成任務。除了Project Astra的升級版，這次Google發布的智能體還包括：完成複雜任務的智能體Project Mariner，能夠幫助開發者的編碼智能體Jules，以及遊戲和其他領域的智能體。