AWS CEO Matt Garman 於 re:Invent 的主題演講:掌握重大發布與關鍵洞察 AWS 重新塑造雲端技術未來:四大核心要素與領先 Agent
- hktechblog
- 1月20日
- 讀畢需時 14 分鐘

2025 AWS re:Invent 全球大會進入第二天議程。 AWS 執行長 Matt Garman 發表題為《AWS 如何重新塑造雲端技術未來》的主題演講,系統闡述了建構 AI Agent 所需的四大核心要素:AI 基礎設施、推論系統、資料、Agent 建構工具。他隆重發布了開創性的 Amazon Nova2 系列基礎模型,以及三大「領先 Agent」(亦稱為前沿 Agent):Kiro Autonomous Agent、Amazon Security Agent、Amazon DevOps Agent ,並宣布 25 項雲端核心服務的重大創新,進一步拉大技術差距,鞏固 AWS 在全球雲端運算與 AI 領域的絕對領導地位。
建構 AI Agent 的四大核心要素
在會議開始時, Matt Garman 首先闡釋了他對 AI 趨勢的理解。他表示, Agentic AI 技術正處於關鍵轉捩點,從「技術奇蹟」轉變為能提供實際業務價值的實用工具。他預測未來將有數十億 Agent 在各行各業廣泛運行,幫助企業實現 10 倍效率提升。而要讓 Agent 真正發揮作用,需要四大核心要素的堅實支援。

01.AI 基礎設施:提供強大且具成本效益的運算能力
Amazon Trainium 晶片系列突破性進展
Matt Garman 宣布正式發布 Amazon Trainium3 Ultra Servers ,這是 AWS 首款搭載 3 奈米製程 AI 晶片的伺服器。它比 Amazon Trainium2 提供 4.4 倍運算能力、3.9 倍記憶體頻寬和 5 倍每兆瓦 AI token 處理量。伺服器最高配置 144 個晶片,提供驚人的 362 petaflops FP8 運算能力。在執行 OpenAI 的 GPT-OSS-120B 模型時,每兆瓦輸出 token 數是 Amazon Trainium2 的 5 倍以上,實現超高能源效率比。

更令人振奮的是, Matt Garman 首次披露了 Amazon Trainium4 晶片,承諾將實現較 Amazon Trainium3 六倍的 FP4 運算效能、四倍記憶體頻寬和兩倍高記憶體容量,持續鞏固 AWS 在 AI 晶片領域的長久領先地位。目前, AWS 已完成超 100 萬個 Trainium2 晶片的大規模部署,為 Amazon Bedrock 中大部分推論工作提供核心運算能力支援,包括 Claude 最新一代模型的高效運行。

GPU 領域的深度合作與創新
AWS 與 NVIDIA 合作已達 15 年,是業界最早在雲端提供 NVIDIA GPU 服務的廠商。 Matt Garman 特別強調, AWS 在 GPU 叢集穩定性方面的表現遠超產業其他供應商。透過深入細節優化(例如除錯 BIOS 以預防 GPU 重新啟動)和對每個問題進行根本原因分析, AWS 確保為客戶提供業界卓越的 GPU 運行穩定性。新發布的 P6e-GB300 實例搭載 NVIDIA 最新 GB NVL72 系統,為最具挑戰性的 AI 工作負載提供支援。 OpenAI 在 AWS 上執行 ChatGPT ,使用數十萬晶片的 Amazon EC2 Ultra 伺服器叢集,可擴展至超過千萬 CPU 。
Amazon AI Factories:突破資料主權限制
受與沙烏地阿拉伯 Neom 新創公司合作啟發, AWS 推出開創性的 Amazon AI Factories 服務。這項服務允許在客戶自有資料中心部署 AWS 專用 AI 基礎設施,運行體驗與 AWS 公有雲區域一致。它利用客戶現有的資料中心空間和電力,存取最新 Amazon Trainium Ultra Servers 或 NVIDIA GPU ,使用 Amazon SageMaker 和 Amazon Bedrock 服務,同時滿足嚴格的法規遵循和資料主權要求。這為無法將資料遷移到雲端的客戶提供了完美解決方案。
客戶案例:Vialet 的科學突破
生物技術公司 Vialet 利用 AWS 強大的 AI 基礎設施訓練「科學多面手」AI ,已處理數兆科學推論 token ,預計未來幾年成長 100 倍。透過 AI 自主提出假設、設計並執行實驗, Vialet 正在加速藥物開發和新材料發現,展現了強大 AI 基礎設施如何推動科學突破。
02. 推論系統:提供廣泛的模型選擇與極佳成本效益
Amazon Bedrock 的全面擴展
Amazon Bedrock 幫助客戶快速將生成式 AI 應用從原型轉為生產環境。 Amazon Bedrock 使用者數量比去年同期成長一倍以上,超過 50 個客戶已處理超過 1 兆個 token 。 Amazon Bedrock 提供廣泛的模型選擇、基於使用情境客製化模型、整合資料工具、添加安全護欄,以及與 AWS 現有服務和資料的深度整合。
第三方模型體系持續豐富
Matt Garman 宣布 Amazon Bedrock 新增 Google Gemma、MiniMax M2、NVIDIA Nemotron、KIMI 開源權重模型。同時提供全新發布的 Mistral3 系列,包括 Mistral Large ,其參數量增加 5 倍以上、上下文視窗大小是 Large2 的兩倍,提供從超高效邊緣設備到單 GPU 部署到進階本地的靈活操作。

Amazon Nova2 系列:成本效益的突破
MattGarman 隆重發布 Amazon Nova2 系列,包括四大模型:
Amazon Nova2 Lite:快速、高成本效益的推論模型,在指令遵循、工具呼叫、程式碼生成、文件資訊提取方面表現出色,效能媲美 Claude Haiku4.5、GPT-5 Mini 和 Gemini2.5 Flash 。
Amazon Nova2 Pro:處理高度複雜工作負載的智慧推論模型,在指令遵循和智慧工具使用方面超越 GPT-5.1、Gemini3 pro 等領先模型。
Amazon Nova2 Sonic:下一代語音到語音模型,提供產業領先的對話品質,改進延遲,大幅擴展語言支援。
Amazon Nova2 Omni:業界首個真正統一的多模態模型,支援文字、影像、影片、音訊輸入,並支援文字和影像輸出。例如可以理解整個會議內容(演講者語言、幻燈片、影片),生成包含文字和影像的摘要





客戶案例:Greatdeal 的內容營運創新
行銷與內容營運公司 Greatdeal 面臨將創意構思轉化為網站內容需 4 到 6 週、涉及 20 多個步驟和多個專業角色的挑戰。透過使用 Amazon Bedrock 和 Amazon Nova 建構編排 Agent ,組合使用不同子 Agent(編寫、設計、網站等),顯著加速內容生產流程,提供更高轉換率的內容。
03. 資料:讓企業獨有資料成為 AI 競爭優勢
資料與模型整合的限制
第三方模型無法深度適應企業特定業務資料,且企業專有資料不能嵌入公共可用模型。現有解決方案存在明顯限制:RAG 和向量資料在推論時提供上下文效果有限;從頭建構模型成本高、資料不足、專業知識要求高;微調開放權重模型難以掌握新領域知識,容易「遺忘」之前學到的能力。
Amazon Nova Forge:開創性的「開放訓練模型」
Matt Garman 宣布推出開創性的 Amazon Nova Forge ,引入「開放訓練模型」概念。 Amazon Nova Forge 提供 Amazon Nova 訓練檢查點的獨家存取權,允許在模型訓練的每個階段混合企業專有資料與 AWS 建立的訓練資料集。產出的模型深度理解企業資訊,同時保留核心能力。
工作流程包括:從 80% 預訓練的 Amazon Nova2 Light 檢查點開始,混合企業資料與 AWS 訓練資料集,使用提供的配方完成預訓練,使用遠端獎勵函數和強化微調進一步改進,最後將模型匯入 Amazon Bedrock 運行推論。例如,硬體製造商可詢問設計 A 與設計 B 的優劣,獲取基於公司歷史結果、製造約束和客戶偏好的具體回答。

客戶案例:Reddit 的內容審核突破
Reddit 需要在多個安全維度審核聊天和搜尋內容。微調現有模型無法達到所需效能,若嘗試使用多個模型處理不同安全維度,則過於複雜且無法達到社群特定要求的準確度。使用 Amazon Nova Forge 將專有領域資料整合到預訓練階段後,首次生產出同時滿足準確性和成本效益目標的專屬模型,部署和營運更簡單,且自然結合了通用語言理解能力和社群特定知識,精準匹配情境需求。
客戶案例:Sony 的資料海洋與 AI 轉型
Sony 建構 Sony Data Ocean ,利用 AWS 每天處理來自 500 多個資料源的 760TB 資料。使用 Amazon Bedrock 建構企業大型語言模型,自推出 2 年來擁有 57,000 使用者,每天處理 150,000 個推論請求。將 Amazon Bedrock Agent Core 置於 Agentic AI 系統中心,輕鬆管控、部署和管理更有用的 Agent 能力。微調 Amazon Nova2.0 Lite 模型,在參考一致性和文件對應方面超越基準模型,目標將 Sony 合規審查和評估流程效率提高 100 倍。
04. Agent 建構工具:提供完整系統支援企業級 Agent
Amazon Bedrock Agent Core:全面增強
Amazon Bedrock Agent Core 使企業能夠規模化安全建構、部署和營運 Agent 。在模組化的設計理念下,客戶可根據需要選擇組件。核心組件包括:安全 Serverless Runtime(Agent 在完全會話隔離中運行)、Agent Core Memory(處理短期和長期記憶)、Agent Core Gateway(Agent 輕鬆發現並安全連接工具、資料和其他 Agent)、Agent Core Identity(提供安全身份驗證)、Agent Core Observability(即時查看已部署 Agent 工作流程)、基礎工具集(包括程式碼解釋器和代管瀏覽器服務)。
系統具有高度開放性:支援多種框架(Crew AI、LlamaIndex、LangChain Strands Agent);支援任何模型(Amazon Bedrock 模型、OpenAI GPT、Google Gemini 等);私有安全部署在 Amazon VPC 內;擴展至數千個會話;部署迅速,透過拖放幾行程式碼實現一分鐘內部署。
Agent Core Policy:即時確定性控制的突破
如何在賦予 Agent 自主性的同時確保可預測行為?Agent Core Policy 提供 Agent 與企業工具和資料交互的即時確定性控制。使用自然語言定義策略(例如「阻止退款金額超過 $1000 的所有客戶退款」),將提示轉換為 Cedar(基於自動推論的開源語言),部署至 Agent Core Gateway ,以毫秒級速度評估所有 Agent 操作。在 Agent 與所有資料、API 和工具之間提供策略評估,確保行為可預測可控。
Agent Core Evaluations:持續品質保證
Agent Core Evaluations 幫助開發人員持續檢查基於真實行為的 Agent 品質。提供 13 個預覽評估器,涵蓋常見品質維度;支援創建自訂評分系統;在測試階段評估 Agent ,在部署前修正問題;在生產環境中快速發現品質下降。結果顯示在 CloudWatch 中,自動化專業知識和基礎設施繁重工作,讓所有人都能存取並持續改進 Agent 品質。






落實 Agent 價值
AI Agent 能夠代表使用者執行任務並進行自動化工作。這正是我們開始看到 AI 投資帶來實質性商業回報的地方。 Matt Garman:「我相信 AI Agent 的出現已經將我們帶到了 AI 發展軌跡的轉捩點——它正在從技術奇蹟轉變為能夠交付真正價值的東西」。 這一變化將對您的業務產生與網際網路或雲端運算同等的影響。我相信在未來,每家公司內部將有數十億個 Agent ,遍布各個可以想像的領域」。 AWS 已看到 Agent 在加速醫療保健發現、改善客戶服務、提高薪資處理效率方面的應用。在某些情況下, Agent 已經開始將人們的影響力擴大十倍。

要真正發揮 Agent 的價值,我們需要具備全面能力的企業 AI 工具支援」。他重點介紹了兩項關鍵工具:
01. 企業 AI 工具的全面能力
Amazon Quick:企業 AI 助手實現 10 倍效率提升
Amazon Quick 的目標是為每位員工提供他們在消費級 AI 中已經開始接受的那種體驗,但配備企業所需的上下文、資料和安全性。其關鍵特點是全面的資料整合能力,整合結構化資料(BI 資料、資料庫、資料倉儲)、應用程式資料(Microsoft365、Jira、ServiceNow、HubSpot、Salesforce)、非結構化資料(個人文件、SharePoint 檔案、Google Drive、Box 檔案等)。

Amazon Quick 提供三大核心功能:豐富的 BI(商業智慧)能力,輕鬆跨所有結構化和非結構化資料源發現洞察;深度研究功能,調查複雜主題,從內部資料儲存庫和網際網路外部源收集資訊,生成詳細研究報告;Quick Flows ,創建個人小型 Agent ,自動化日常重複任務,提高個人和團隊效率。
幾個月前, AWS 在內部發布了 Amazon Quick Suite ,如今已有數十萬使用者。團隊回報完成任務的時間是原來的 1/10 。 AWS 稅務團隊建構了一個 Amazon Quick Agent ,幫助他們整合所有稅務資料來源、獲取稅務專案資料、稽核資料、網際網路上的細節,對任何稅法或政策變更執行深度研究,並在單一視圖中呈現所有這些稅務資訊——這些都是非開發人員完成的,他們無需編寫任何程式碼或手動拉取任何報告就能做到。
Amazon Transform Custom:消除科技債的開創性工具
科技債每年在美國造成約 2.4 兆美元的成本, 70% 的 IT 預算用於維護遺留系統。 Amazon Transform Custom 讓客戶能夠創建自訂程式碼轉換 Agent ,以現代化任何程式碼、API、框架或 Runtime ,甚至包括僅在公司內部使用的程式語言或框架。雲端 ERP 解決方案提供商 QAD 使用 Amazon Transform 後,原本至少需要 2 週完成的轉換工作在不到 3 天內完成,顯著加速了客戶的現代化進程。
02. 三大領先 Agent:開發人員工具的開創性突破
改變每個人業務的最大機遇之一就是 Agent 。 Agent 令人興奮,因為它們可以採取行動並完成任務。它們可以動態推論,並以最佳方式創建工作流程來解決問題,而無需您預先編寫程式。領先 Agent 具有三個關鍵特徵:自主性(朝目標前進並自行決定如何實現)、大規模可擴展(單個 Agent 可執行多任務,同時支援跨多個實例分配工作)、長時運行(可工作數小時甚至數天,無需人工干預)。

Kiro Autonomous Agent:變革軟體開發方式
Kiro Autonomous Agent 變革開發人員和團隊建構軟體的方式,大幅提升開發能力。它與開發流程並行運行,保持上下文並自動化開發任務。自主完成從功能交付到錯誤分類到改進程式碼覆蓋率的全部工作。與 Jira、GitHub、Slack 等現有工具連接。學習團隊工作方式,持續深化對程式碼、產品和團隊標準的理解。
在跨儲存庫更新情境中,傳統方式需要在 15 個不同微服務中逐一打開程式碼庫,提示更新、審查變更、執行測試、創建提取請求。 Kiro 方式:在 kiro.dev 啟動與 GitHub 關聯的任務,描述問題後 Agent 提出澄清問題並規劃任務,利用對整個程式碼庫的瞭解識別需要更新的所有位置,分析每個服務如何使用函式庫,遵循現有模式更新程式碼,執行測試並開啟 15 個經過測試、準備合併的提取請求。內部案例顯示 6 人團隊在 76 天內完成原計畫 30 人 18 個月的專案。
Amazon Security Agent:從設計階段建構安全應用
從設計階段開始建構安全應用,在加速開發同時確保安全性。主動審查設計文件,在編寫程式碼前發現安全問題。識別程式碼中的漏洞。直接整合 GitHub 提取請求,在開發工作流程中提供回饋。將緩慢昂貴的滲透測試轉變為隨選實踐。避免因安全問題導致的程式碼重寫,無需昂貴的外部顧問,允許更頻繁地進行安全驗證。
Amazon DevOps Agent:主動預防營運事件
解決和主動預防事件,持續提高可靠性和效能。像經驗豐富的 DevOps 工程師一樣調查事件並識別營運改進。從資源、關係、現有可觀察性解決方案、操作手冊、程式碼庫和 CI/CD 管道學習。關聯所有來源的遙測、程式碼和部署資料。 在身份驗證錯誤處理情境中,當警報觸發顯示 Lambda 函數連接資料庫時身份驗證錯誤率升高, DevOps Agent 在值班工程師查看前立即回應,診斷問題,利用應用程式拓撲知識和組件關係理解追溯警報找出根本原因,確定問題是 Lambda 函數 IAM 策略變更導致,找出引入變更的 CDK 程式碼部署,提出修復並準備供值班工程師核准,推薦 CI/CD 護欄防止類似問題再次發生。
這些領先 Agent 正在將 AI 從技術展示轉變為真正的生產力工具,幫助企業實現 10 倍效率提升,迎接 AI Agent 時代的無限可能。
25 項雲端核心服務重大創新
延續 AWS「建構單元」理念, Matt Garman 快速發布了 25 項雲端核心服務創新,涵蓋運算、儲存、資料庫等領域:

運算服務創新
X 系列大記憶體實例搭載客製化 Intel Xeon6 處理器,提供 50% 更多記憶體,適用於 SAP HANA、SQL Server、EDA 應用程式。
C8a 實例基於最新 AMD EPYC 處理器,效能提升 30% ,適用於批次處理、遊戲等 CPU 密集型應用程式。
C8ine 實例搭載客製化 Intel Xeon6 處理器,使用最新 Nitro V6 卡,每 vCPU 提供 2.5 倍更高的封包處理效能,適用於安全和網路應用程式。
M8azn 實例擁有 AWS 實例中最高 CPU 時脈頻率,適用於多人遊戲、高頻交易、即時資料分析。
EC2 M3 Ultra Mac 和 M4 Max Mac 實例搭載最新 Apple 硬體,用於建構、測試、簽署 Apple 應用程式。
Lambda durable functions 允許在 Lambda 函數中直接編寫程式碼等待時間,管理狀態、建構長時運行工作負載,內建錯誤處理和自動恢復。
儲存服務突破
Amazon S3 物件大小上限從 5TB 增加到 50TB(增加 10 倍),適用於處理超大資料檔案。
Amazon S3 批次處理操作速度提升 10 倍。
Amazon S3 Tables Intelligent Tiering 為 S3 Table 儲存貯體中的資料自動節省高達 80% 儲存成本。
Amazon S3 Tables Cross-Region Replication 自動複寫 S3 Table 到其他 AWS 區域和帳戶,確保從任何地方獲得一致的查詢效能。
Amazon S3 Access Points 支援 FSx for NetApp ONTAP ,擴展 S3 存取點以包括 NetApp ONTAP 支援,讓 NetApp 客戶能像存取 S3 一樣無縫存取資料。
Amazon S3 Vectors 正式發布,原生支援儲存和查詢向量的雲端物件儲存,在單個 S3 儲存貯體中儲存數兆級向量,降低儲存和查詢成本 90% 。
OpenSearch vector index GPU 加速,使用 GPU 索引資料,速度提升 10 倍,成本降低至 1/4 。
資料庫服務升級
Amazon RDS for SQL Server 和 Oracle 儲存容量從 64TB 增加到 256TB , I/OPS 和 IO 頻寬提升 4 倍,更易遷移現有工作負載並在 AWS 上擴展。
Amazon SQL Server 資料庫實例可指定 vCPU 數量,幫助減少來自 Microsoft 的每 CPU 授權成本。
支援 Amazon SQL Server Developer Edition ,無需授權費用建構和測試應用程式。
Database Savings Plans 在所有資料庫服務使用中節省高達 35% 。
其他關鍵服務
Amazon EMR Serverless 無需預先佈建本地儲存,消除為 Amazon EMR Serverless 叢集預先佈建和管理本地儲存的需要。
Amazon GuardDuty Extended Threat Detection 將進階威脅偵測能力擴展到 Amazon ECS 容器,所有 GuardDuty 客戶無需額外成本即可使用。
Amazon Security Hub 正式發布新增功能包括近即時風險分析、趨勢儀表板、簡化定價模型。
CloudWatch Unified Data Store 用於所有營運、安全和法規遵循資料。它自動從 AWS 和第三方收集日誌資料,儲存在 Amazon S3 或 S3 Table 中,便於查找問題和獲取洞察。
重大業務成就:見證雲端運算領導者地位
Matt Garman 展示了 AWS 驚人的業務成就:達到 1,320 億美元規模,同比增長 20%(過去 12 個月增長約 220 億美元,超過財富 500 強一半企業的年收入);Amazon S3 儲存超過 500 兆個物件,每秒處理超過 2 億次請求;超過一半的 CPU 容量來自 Amazon Graviton 處理器;Amazon Bedrock 服務 10 萬家公司,超過 50 個客戶已處理超過 1 兆個 token;Amazon Bedrock Agent Core SDK 下載量超過 200 萬次。
展望 Agentic AI 時代的無限可能
Matt Garman 總結道,我們正處於一個前所未有的時代, AI Agent 技術將徹底改變企業營運方式。 AWS 透過從晶片到模型到 Agent 的全棧式創新,為客戶提供建構 AI Agent 所需的四大核心要素。 隨著 Kiro Autonomous Agent、Amazon Security Agent 和 Amazon DevOps Agent——這三大領先 Agent 的問世,開發人員將獲得前所未有的生產力提升。配合 25 項雲端核心服務的重大創新, AWS 正在幫助客戶實現 AI 的真正價值。隨著數十億 Agent 在各行各業運行,企業將實現 10 倍效率提升,迎接 AI Agent 時代的無限可能。
本文章內容由「Amazon Web Services (AWS)」提供。



留言