HK TECH BLOG | 科技

從『只有科技巨頭負擔得起』到『中型企業也能訓練大型模型』：AWS Trainium3 如何改變 AI 訓練的遊戲規則？

來源： https://www.aboutamazon.com/news/aws/trainium-3-ultraserver-faster-ai-training-lower-cost 訓練一個 Frontier Model (前沿模型) 需要多少錢？OpenAI 的 GPT-4 訓練成本估計超過 1 億美元，Google 的 Gemini 和 Anthropic 的 Claude 也都在相似量級。這些數字背後是數千張 GPU (Graphics Processing Unit，圖形處理器)、數月的運算時間，以及龐大的電力和冷卻基礎設施投資。過去，只有 FAANG (Facebook、Apple、Amazon、Netflix、Google) 等科技巨頭能負擔這樣的成本，AI 訓練的門檻將大多數中型企業和研究機構擋在門外。但這個局面正在改變。AWS 推出的 Trainium3 UltraServers 讓 Anthropic 的訓練成本降低達 50%，讓 Decart 的即時生成影片推論速度提升 4 倍且成本減半，Amazon Bedrock

hktechblog

1月31日讀畢需時 15 分鐘

AWS 資料庫費用瘦身指南：擺脫傳統合約限制，用 Database Savings Plans 省下 35% 預算

一家中型電商平台，光是資料庫費用一年可能就高達 120 萬美元。面對這筆龐大支出，企業往往陷入兩難：財務長希望能簽訂長約省錢，技術長卻擔心簽了約會綁死架構，阻礙未來的技術更新。過去，企業為了獲得折扣，不得不購買 Reserved Instances (RI，預留執行個體) ，但這往往伴隨著高昂的隱形成本：一旦業務轉型、更換資料庫類型或跨國擴張，原本買好的 RI 合約就成了無法變現的「沈沒成本」。 AWS 推出的 Database Savings Plans 正是為了解決這個痛點而生。它打破了傳統合約的僵化限制，提供最高 35% 的折扣，並具備跨服務、跨區域的自動適用特性。本文將解析這個方案如何幫助台灣企業在「降低成本」與「保持彈性」之間取得最佳平衡。為什麼傳統的 RI 模式不再好用？傳統的 Reserved Instances (RI) 邏輯很簡單：你承諾使用特定的資源 (例如：在美國東岸使用 RDS MySQL)，AWS 給你折扣。這對靜態環境有效，但在快速變動的現代商業環境中，RI 的三大限制卻成了絆腳石：綁死服務種類：你為 R

hktechblog

1月31日讀畢需時 4 分鐘

AI 寫完程式就忘記、工具一開就卡頓？AWS 推出的 Kiro 為何能「越用越懂你的專案」？

一位新創技術長每天都要經歷同樣的困擾：打開開發工具後，花十分鐘向 AI 助手重新解釋專案架構、資料庫設計、程式規範——即使昨天才剛說過。更糟的是，開發工具啟動時自動載入了數十個外掛程式，但今天只需要處理資料庫工作，其他工具只是拖慢速度、佔用寶貴的記憶空間。這不是個案。根據開發者社群調查，超過 70% 的團隊每天花費 1 至 2 小時「重新教育」AI 工具。在 AWS re:Invent 2025 大會上， AWS 發表 Kiro ，透過持續性記憶與智能工具載入兩大核心能力，徹底解決這些長期困擾開發者的問題。為何 AI 總是「短期記憶」？記憶空間的先天限制當你與 AI 助手對話時，所有歷史訊息都儲存在一個有限的記憶空間中。即使最先進的模型也只能記住最近的內容，當對話過長時，早期的內容會被「遺忘」。更關鍵的是，當你關閉對話或重啟開發工具時，這些記憶會完全清空——你必須從零開始重新建立理解。對個人開發者而言，「每次重新解釋」已經夠麻煩；對團隊來說問題更嚴重。當同事昨天與 AI 討論了複雜的邏輯實作，今天你接手相關功能時，AI 對那段討論毫無

hktechblog

1月31日讀畢需時 10 分鐘

AI 如何真正「看懂」影片?全球最強影片理解模型 TwelveLabs Marengo 3.0 在 Amazon Bedrock 登場

當企業擁有數以萬計的影片資產——產品展示、客戶見證、培訓內容、行銷素材——卻無法有效搜尋與利用時，這些資料就只是佔用儲存空間的成本，而非創造價值的資產。傳統的影片搜尋依賴人工標籤或基本的語音轉文字，既耗時又不準確。 2025 年 12 月 1 日，TwelveLabs 在 AWS re:Invent 大會上宣布 Marengo 3.0 正式推出，這個號稱「全球最強」的影片理解模型現已在 Amazon Bedrock 和 TwelveLabs 平台上提供服務。不同於傳統模型的逐幀分析，Marengo 3.0 將影片視為完整的動態系統，能「直接連結」其中涵蓋的對話、手勢、動作與情緒內容。數據證明其突破性：儲存成本降低 50%、索引效能提升 2 倍、支援長達 4 小時的影片、辨識 36 種語言。這不只是技術進步，而是讓企業能以「搜尋文字的方式」輕鬆搜尋與理解影片內容的典範轉移。從「看」到「看懂」：影片理解的典範轉移傳統方法的根本限制人類觀看影片時，不只是處理一系列靜止畫面。我們理解劇情發展、感受情緒變化、預測接下來會發生什麼。一個角色在開場時

hktechblog

1月30日讀畢需時 10 分鐘

AI 代理擅自批准百萬退款？AWS AgentCore Policy 如何毫秒級攔截 AI 危險行為？

一家 SaaS 公司剛將 AI 客服代理部署到生產環境，原本預期它能自動處理退款申請、加速客戶服務流程。然而，上線第三天，財務部門發現一筆異常：AI 代理在深夜批准了一筆 5 萬美元的退款請求，而公司政策明確規定超過 1,000 美元的退款必須人工審核。更糟的是，團隊花了兩天時間追查日誌，才找到問題根源——AI 代理在理解客戶訴求時，誤判了退款的「合理性」，繞過了原本設計的檢查機制。這不是孤立案例。當 AI 代理被賦予更多自主權——從存取資料庫、呼叫 API、到執行業務邏輯——它們的「能力」與「風險」同步攀升。傳統的「透過提示詞約束行為」已不足以應對生產環境的複雜性，企業需要的是一套能在代理程式碼之外、即時且確定性地控制代理行為的機制。 AWS Amazon Bedrock AgentCore 推出的 Policy in AgentCore 正是為了解決這個問題：讓團隊用自然語言定義政策 (如「禁止超過 1,000 美元的退款」)，並在毫秒級內攔截違規行為，確保 AI 代理在自主運作的同時，始終遵守企業規範。為何 AI 代理的自主性讓企業不

hktechblog

1月30日讀畢需時 10 分鐘

從「災難性遺忘」到「深度整合專有知識」：Reddit、Sony 用 Nova Forge 開放訓練解決 AI 客製化三難困境

當企業試圖將通用 AI 模型客製化以融入專有知識時，往往面臨一個「不可能三角」：選擇透過提示工程 (Prompt Engineering) 或檢索增強生成 (Retrieval Augmented Generation, RAG) 進行淺層客製化，但無法將知識真正嵌入模型核心；或是持續訓練開源模型，卻面臨「災難性遺忘」 (Catastrophic Forgetting) 的風險，讓模型在學習新知識的同時失去原有的基礎能力；又或是從零開始建構模型，但成本高昂且耗時數年，只有少數頂尖企業負擔得起。這個困境讓許多擁有大量專有數據的企業陷入兩難：通用模型無法理解自己的業務，但客製化模型的技術與成本門檻又過高。AWS 在 re:Invent 2025 大會上發布的 Amazon Nova Forge 服務，正是為了打破這個僵局。透過業界首創的「開放訓練」 (Open Training) 方法，Nova Forge 讓企業能在預訓練、中期訓練、後期訓練三個階段都注入專有知識，同時避免災難性遺忘的風險。 Reddit、Sony、 Booking.com

hktechblog

1月29日讀畢需時 10 分鐘

從 4 個分散工具到 1 個統一平台：AWS Security Hub 如何實現近即時威脅關聯與 1 年趨勢追蹤

一家金融服務公司的安全團隊每天早上都面臨同樣的挑戰：安全分析師需要登入 Amazon GuardDuty 檢查威脅偵測警報、切換到 Amazon Inspector 查看漏洞掃描結果、再開啟 Amazon Macie 確認資料洩漏風險、最後還要登入 Security Hub CSPM 檢查配置偏移。四個不同的主控台、四組不同的警報、四種不同的優先級判斷標準——當一個 EC2 執行個體同時出現在 GuardDuty 的惡意活動警報和 Inspector 的高風險漏洞清單中時，團隊需要手動拼湊這些訊號，才能理解真正的風險全貌。更糟的是，當資安長 (CISO) 詢問「過去三個月我們的整體安全態勢是改善還是惡化？」時，分析師必須從四個系統匯出資料、手動製作報表，而這個過程往往需要數天時間。這不是個案，而是許多企業在使用多個 AWS 安全服務時面臨的真實困境。今天， AWS Security Hub 正式發布 (General Availability)，透過統一平台、近即時威脅關聯、以及長達 1 年的歷史趨勢資料，徹底改變企業安全營運的方式。 4

hktechblog

1月29日讀畢需時 16 分鐘

為什麼代理式 AI 難以進入生產環境？Workday 如何使用 Amazon Bedrock AgentCore 四大功能解決生產環境四大障礙

在 AI 技術快速演進的 2024 年，企業對「代理式 AI」 (Agentic AI) 的期待達到前所未有的高度。然而，當企業嘗試將代理從實驗室搬進生產環境時,卻發現一個殘酷的現實：代理式 AI 的自主性 (Autonomy) 成為最大的阻礙。代理能夠自主推理、呼叫工具、執行任務，但也正因為這種自主性，企業面臨四大生產環境障礙：失控風險、品質不穩定、無法學習、對話僵硬。這些障礙的真實代價正在顯現。PGA TOUR 在導入 Amazon Bedrock AgentCore 之前，內容生成流程耗時且昂貴；Workday 的財務規劃團隊每月需要花費數百小時進行例行性分析；Grupo Elfa (巴西經銷零售商) 的銷售團隊每天需處理數千個報價，卻對代理決策缺乏可見性。但情況正在改變。PGA TOUR 透過 AgentCore 建構的多代理內容生成系統，將內容撰寫速度提升 1000%，同時將成本降低 95%，現在能為賽場上每一位選手提供全面報導。Workday 的 Planning Agent 使用 AgentCore Code Interpre

hktechblog

1月28日讀畢需時 11 分鐘

技術債不再是夢魘——加拿大航空讓代理式 AI 接手數千個函數的現代化轉換

每個資訊科技 (Information Technology, IT) 團隊都知道技術債的夢魘：當業務需要新功能時，30% 的時間卻必須花在維護老舊系統、手動搬遷資料、重寫過時程式碼。這不是效率問題，而是創新的枷鎖——當最優秀的工程師被困在重複性的現代化工作中，企業的競爭力正在流失。加拿大航空 (Air Canada) 找到了打破這個循環的方法。透過 AWS Transform 的客製化能力 (Custom Capability)，他們在短短幾天內完成了數千個 AWS Lambda 函數的現代化轉換，專案執行時間與成本雙雙降低 80%。這不是個案，而是代理式人工智慧 (Artificial Intelligence, AI) 改寫應用程式現代化規則的開端。技術債的真實代價：創新資源的隱形流失技術債不只是陳舊的程式碼，而是組織敏捷性的持續消耗。當系統建立在過時的程式語言、框架或基礎架構上時，每次升級、每次整合、每次擴展都需要額外的工程時間。AWS 指出，企業 IT 團隊經常需要額外花費 30% 時間成本進行手動現代化工作。 30% 成本背

hktechblog

1月28日讀畢需時 11 分鐘

安全漏洞總在上線後才發現？AWS Security Agent 如何從設計階段就攔截『看不見的威脅』？

一家金融科技新創在產品上線兩週後，收到資安研究員的漏洞通報：他們的支付 API 在特定情況下會在回應中洩露其他使用者的交易記錄。更令團隊震驚的是，這個漏洞並非傳統的 SQL 注入或跨站腳本攻擊 (XSS)——所有程式碼掃描工具、靜態分析、甚至第三方安全稽核都沒有發現任何異常。問題出在「業務邏輯」：當使用者查詢交易狀態時，系統正確驗證了身份，但在資料過濾邏輯中存在一個微妙的判斷錯誤，導致回應包含了不該被看見的資訊。修復這個漏洞花了三天，但更大的損失是信任——客戶質疑「還有多少類似的問題沒被發現？」這不是孤立案例。根據 OWASP (Open Web Application Security Project) 的統計，業務邏輯漏洞佔所有嚴重安全問題的 15% 至 20%，但它們極少被自動化工具偵測到，因為這類問題需要理解應用程式的「預期行為」與「實際行為」之間的差距——這正是傳統工具的盲點。當企業將安全檢查推遲到開發後期或部署前夕，發現問題時往往已經投入大量資源，修復成本與時間壓力都會倍增。AWS 推出的 AWS Security Agent 正

hktechblog

1月27日讀畢需時 10 分鐘

淺談 Amazon 郵件誤寄事件及如何透過 Email DLP 避免寄錯信件

近日，Amazon 不小心洩漏了禮品卡訂單確認電子郵件，將 Google Play、Hotels.com 和 Mastercard 的禮品卡訂單資訊發送給了錯誤的收件人。

了解更多