Google Gemini 3 Deep Think 升級!程式競賽奪金牌,OpenAI 同日發布 GPT-5.3 新模型

科技巨頭 AI 競賽白熱化! Google 母公司字母(Alphabet)正式發布了旗艦級 AI 模型 Gemini 3 Deep Think 的重大升級。這款模型在頂尖程式競賽平台 Codeforces 展現驚人實力,成功拿下 3,455 的高分,目前全球僅有不到十位人類選手的評分能超越該模型。

根據官方資料顯示, Gemini 3 Deep Think 在多項嚴苛的測試中表現優異。該模型在「人類最後考試」(Humanity’s Last Exam)中取得 48.4% 的答對率,並在數學與物理等 科學研究 基準測試中達到金牌水準,顯示出極強的邏輯推理能力。

為了確保資訊的準確性,這款新模型導入了 Google 搜尋 功能,能有效避免 AI 常見的幻覺問題或錯誤引用。這項進步將大幅提升其在學術研究上的應用價值,協助全球科學家將複雜的 理論模型 轉化為實際的產業應用,縮短研發週期。

與此同時,競爭對手 OpenAI 也不甘示弱,於同日推出了專為開發者設計的 GPT-5.3-Codex-Spark 精簡版模型。這款模型最大的特色是能在 Cerebras 系統的高效能晶片上運行,大幅優化了 AI 模型在處理程式碼時的反應速度與運算效率。

這款針對 軟體工程師 開發的新工具,允許使用者隨時中斷並切換不同的任務,無需等待繁瑣的運算過程。 OpenAI 此舉旨在擴大其 硬體生態系 ,除了長期合作的輝達之外,也積極與超微及博通等半導體廠展開深度合作,以確保算力供應多元化。

在 AI 國際競爭方面, OpenAI 近期也向美國政府表達對海外競爭對手 DeepSeek 的關注。據悉, OpenAI 指控對手利用精細手段擷取美國領先模型的研究結果,用以訓練其 R1 聊天機器人 ,這也引發了各界對於 AI 技術產權與不公平競爭的熱烈討論。

常見問題

Gemini 3 Deep Think 在程式設計領域的表現如何?
該模型在 Codeforces 平台獲得 3,455 分,排名優於全球絕大多數的人類工程師,且在科學基準測試中達到金牌等級。

OpenAI 新推出的 GPT-5.3-Codex-Spark 有什麼優點?
這是一款針對程式碼編輯與測試設計的精簡版模型,能即時中斷並執行多工作業,並透過 Cerebras 晶片提升運算反應速度。

為什麼 Google 的新模型要連結搜尋功能?
透過結合 Google 搜尋,模型可以即時核實資訊,減少資料錯誤引用,提供更精確的數學與科學研究支援。

AI 玩新聞小編
AI 玩新聞小編
文章: 180

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *