top of page


從『只有科技巨頭負擔得起』到『中型企業也能訓練大型模型』:AWS Trainium3 如何改變 AI 訓練的遊戲規則?
來源: https://www.aboutamazon.com/news/aws/trainium-3-ultraserver-faster-ai-training-lower-cost 訓練一個 Frontier Model (前沿模型) 需要多少錢?OpenAI 的 GPT-4 訓練成本估計超過 1 億美元,Google 的 Gemini 和 Anthropic 的 Claude 也都在相似量級。這些數字背後是數千張 GPU (Graphics Processing Unit,圖形處理器)、數月的運算時間,以及龐大的電力和冷卻基礎設施投資。過去,只有 FAANG (Facebook、Apple、Amazon、Netflix、Google) 等科技巨頭能負擔這樣的成本,AI 訓練的門檻將大多數中型企業和研究機構擋在門外。 但這個局面正在改變。AWS 推出的 Trainium3 UltraServers 讓 Anthropic 的訓練成本降低達 50%,讓 Decart 的即時生成影片推論速度提升 4 倍且成本減半,Amazon Bedrock
hktechblog
4小时前讀畢需時 15 分鐘


AWS 資料庫費用瘦身指南:擺脫傳統合約限制,用 Database Savings Plans 省下 35% 預算
一家中型電商平台,光是資料庫費用一年可能就高達 120 萬美元。面對這筆龐大支出,企業往往陷入兩難:財務長希望能簽訂長約省錢,技術長卻擔心簽了約會綁死架構,阻礙未來的技術更新。 過去,企業為了獲得折扣,不得不購買 Reserved Instances (RI,預留執行個體) ,但這往往伴隨著高昂的隱形成本:一旦業務轉型、更換資料庫類型或跨國擴張,原本買好的 RI 合約就成了無法變現的「沈沒成本」。 AWS 推出的 Database Savings Plans 正是為了解決這個痛點而生。它打破了傳統合約的僵化限制,提供最高 35% 的折扣,並具備跨服務、跨區域的自動適用特性。本文將解析這個方案如何幫助台灣企業在「降低成本」與「保持彈性」之間取得最佳平衡。 為什麼傳統的 RI 模式不再好用? 傳統的 Reserved Instances (RI) 邏輯很簡單:你承諾使用特定的資源 (例如:在美國東岸使用 RDS MySQL),AWS 給你折扣。這對靜態環境有效,但在快速變動的現代商業環境中,RI 的三大限制卻成了絆腳石: 綁死服務種類: 你為 R
hktechblog
8小时前讀畢需時 4 分鐘


AI 寫完程式就忘記、工具一開就卡頓?AWS 推出的 Kiro 為何能「越用越懂你的專案」?
一位新創技術長每天都要經歷同樣的困擾:打開開發工具後,花十分鐘向 AI 助手重新解釋專案架構、資料庫設計、程式規範——即使昨天才剛說過。更糟的是,開發工具啟動時自動載入了數十個外掛程式,但今天只需要處理資料庫工作,其他工具只是拖慢速度、佔用寶貴的記憶空間。 這不是個案。根據開發者社群調查,超過 70% 的團隊每天花費 1 至 2 小時「重新教育」AI 工具。在 AWS re:Invent 2025 大會上, AWS 發表 Kiro ,透過持續性記憶與智能工具載入兩大核心能力,徹底解決這些長期困擾開發者的問題。 為何 AI 總是「短期記憶」? 記憶空間的先天限制 當你與 AI 助手對話時,所有歷史訊息都儲存在一個有限的記憶空間中。即使最先進的模型也只能記住最近的內容,當對話過長時,早期的內容會被「遺忘」。更關鍵的是,當你關閉對話或重啟開發工具時,這些記憶會完全清空——你必須從零開始重新建立理解。 對個人開發者而言,「每次重新解釋」已經夠麻煩;對團隊來說問題更嚴重。當同事昨天與 AI 討論了複雜的邏輯實作,今天你接手相關功能時,AI 對那段討論毫無
hktechblog
16小时前讀畢需時 10 分鐘


AI 如何真正「看懂」影片?全球最強影片理解模型 TwelveLabs Marengo 3.0 在 Amazon Bedrock 登場
當企業擁有數以萬計的影片資產——產品展示、客戶見證、培訓內容、行銷素材——卻無法有效搜尋與利用時,這些資料就只是佔用儲存空間的成本,而非創造價值的資產。傳統的影片搜尋依賴人工標籤或基本的語音轉文字,既耗時又不準確。 2025 年 12 月 1 日,TwelveLabs 在 AWS re:Invent 大會上宣布 Marengo 3.0 正式推出,這個號稱「全球最強」的影片理解模型現已在 Amazon Bedrock 和 TwelveLabs 平台上提供服務。不同於傳統模型的逐幀分析,Marengo 3.0 將影片視為完整的動態系統,能「直接連結」其中涵蓋的對話、手勢、動作與情緒內容。 數據證明其突破性:儲存成本降低 50%、索引效能提升 2 倍、支援長達 4 小時的影片、辨識 36 種語言。這不只是技術進步,而是讓企業能以「搜尋文字的方式」輕鬆搜尋與理解影片內容的典範轉移。 從「看」到「看懂」:影片理解的典範轉移 傳統方法的根本限制 人類觀看影片時,不只是處理一系列靜止畫面。我們理解劇情發展、感受情緒變化、預測接下來會發生什麼。一個角色在開場時
hktechblog
1天前讀畢需時 10 分鐘


AI 代理擅自批准百萬退款?AWS AgentCore Policy 如何毫秒級攔截 AI 危險行為?
一家 SaaS 公司剛將 AI 客服代理部署到生產環境,原本預期它能自動處理退款申請、加速客戶服務流程。然而,上線第三天,財務部門發現一筆異常:AI 代理在深夜批准了一筆 5 萬美元的退款請求,而公司政策明確規定超過 1,000 美元的退款必須人工審核。更糟的是,團隊花了兩天時間追查日誌,才找到問題根源——AI 代理在理解客戶訴求時,誤判了退款的「合理性」,繞過了原本設計的檢查機制。 這不是孤立案例。當 AI 代理被賦予更多自主權——從存取資料庫、呼叫 API、到執行業務邏輯——它們的「能力」與「風險」同步攀升。傳統的「透過提示詞約束行為」已不足以應對生產環境的複雜性,企業需要的是一套能在代理程式碼之外、即時且確定性地控制代理行為的機制。 AWS Amazon Bedrock AgentCore 推出的 Policy in AgentCore 正是為了解決這個問題:讓團隊用自然語言定義政策 (如「禁止超過 1,000 美元的退款」),並在毫秒級內攔截違規行為,確保 AI 代理在自主運作的同時,始終遵守企業規範。 為何 AI 代理的自主性讓企業不
hktechblog
2天前讀畢需時 10 分鐘


從「災難性遺忘」到「深度整合專有知識」:Reddit、Sony 用 Nova Forge 開放訓練解決 AI 客製化三難困境
當企業試圖將通用 AI 模型客製化以融入專有知識時,往往面臨一個「不可能三角」:選擇透過提示工程 (Prompt Engineering) 或檢索增強生成 (Retrieval Augmented Generation, RAG) 進行淺層客製化,但無法將知識真正嵌入模型核心;或是持續訓練開源模型,卻面臨「災難性遺忘」 (Catastrophic Forgetting) 的風險,讓模型在學習新知識的同時失去原有的基礎能力;又或是從零開始建構模型,但成本高昂且耗時數年,只有少數頂尖企業負擔得起。 這個困境讓許多擁有大量專有數據的企業陷入兩難:通用模型無法理解自己的業務,但客製化模型的技術與成本門檻又過高。AWS 在 re:Invent 2025 大會上發布的 Amazon Nova Forge 服務,正是為了打破這個僵局。透過業界首創的「開放訓練」 (Open Training) 方法,Nova Forge 讓企業能在預訓練、中期訓練、後期訓練三個階段都注入專有知識,同時避免災難性遺忘的風險。 Reddit、Sony、 Booking.com
hktechblog
2天前讀畢需時 10 分鐘


從 4 個分散工具到 1 個統一平台:AWS Security Hub 如何實現近即時威脅關聯與 1 年趨勢追蹤
一家金融服務公司的安全團隊每天早上都面臨同樣的挑戰:安全分析師需要登入 Amazon GuardDuty 檢查威脅偵測警報、切換到 Amazon Inspector 查看漏洞掃描結果、再開啟 Amazon Macie 確認資料洩漏風險、最後還要登入 Security Hub CSPM 檢查配置偏移。四個不同的主控台、四組不同的警報、四種不同的優先級判斷標準——當一個 EC2 執行個體同時出現在 GuardDuty 的惡意活動警報和 Inspector 的高風險漏洞清單中時,團隊需要手動拼湊這些訊號,才能理解真正的風險全貌。更糟的是,當資安長 (CISO) 詢問「過去三個月我們的整體安全態勢是改善還是惡化?」時,分析師必須從四個系統匯出資料、手動製作報表,而這個過程往往需要數天時間。這不是個案,而是許多企業在使用多個 AWS 安全服務時面臨的真實困境。今天, AWS Security Hub 正式發布 (General Availability),透過統一平台、近即時威脅關聯、以及長達 1 年的歷史趨勢資料,徹底改變企業安全營運的方式。 4
hktechblog
3天前讀畢需時 16 分鐘


為什麼代理式 AI 難以進入生產環境?Workday 如何使用 Amazon Bedrock AgentCore 四大功能解決生產環境四大障礙
在 AI 技術快速演進的 2024 年,企業對「代理式 AI」 (Agentic AI) 的期待達到前所未有的高度。然而,當企業嘗試將代理從實驗室搬進生產環境時,卻發現一個殘酷的現實:代理式 AI 的自主性 (Autonomy) 成為最大的阻礙。代理能夠自主推理、呼叫工具、執行任務,但也正因為這種自主性,企業面臨四大生產環境障礙:失控風險、品質不穩定、無法學習、對話僵硬。 這些障礙的真實代價正在顯現。PGA TOUR 在導入 Amazon Bedrock AgentCore 之前,內容生成流程耗時且昂貴;Workday 的財務規劃團隊每月需要花費數百小時進行例行性分析;Grupo Elfa (巴西經銷零售商) 的銷售團隊每天需處理數千個報價,卻對代理決策缺乏可見性。 但情況正在改變。PGA TOUR 透過 AgentCore 建構的多代理內容生成系統,將內容撰寫速度提升 1000%,同時將成本降低 95%,現在能為賽場上每一位選手提供全面報導。Workday 的 Planning Agent 使用 AgentCore Code Interpre
hktechblog
3天前讀畢需時 11 分鐘


技術債不再是夢魘——加拿大航空讓代理式 AI 接手數千個函數的現代化轉換
每個資訊科技 (Information Technology, IT) 團隊都知道技術債的夢魘:當業務需要新功能時,30% 的時間卻必須花在維護老舊系統、手動搬遷資料、重寫過時程式碼。這不是效率問題,而是創新的枷鎖——當最優秀的工程師被困在重複性的現代化工作中,企業的競爭力正在流失。 加拿大航空 (Air Canada) 找到了打破這個循環的方法。透過 AWS Transform 的客製化能力 (Custom Capability),他們在短短幾天內完成了數千個 AWS Lambda 函數的現代化轉換,專案執行時間與成本雙雙降低 80%。這不是個案,而是代理式人工智慧 (Artificial Intelligence, AI) 改寫應用程式現代化規則的開端。 技術債的真實代價:創新資源的隱形流失 技術債不只是陳舊的程式碼,而是組織敏捷性的持續消耗。當系統建立在過時的程式語言、框架或基礎架構上時,每次升級、每次整合、每次擴展都需要額外的工程時間。AWS 指出,企業 IT 團隊經常需要額外花費 30% 時間成本進行手動現代化工作。 30% 成本背
hktechblog
4天前讀畢需時 11 分鐘


安全漏洞總在上線後才發現?AWS Security Agent 如何從設計階段就攔截『看不見的威脅』?
一家金融科技新創在產品上線兩週後,收到資安研究員的漏洞通報:他們的支付 API 在特定情況下會在回應中洩露其他使用者的交易記錄。更令團隊震驚的是,這個漏洞並非傳統的 SQL 注入或跨站腳本攻擊 (XSS)——所有程式碼掃描工具、靜態分析、甚至第三方安全稽核都沒有發現任何異常。問題出在「業務邏輯」:當使用者查詢交易狀態時,系統正確驗證了身份,但在資料過濾邏輯中存在一個微妙的判斷錯誤,導致回應包含了不該被看見的資訊。修復這個漏洞花了三天,但更大的損失是信任——客戶質疑「還有多少類似的問題沒被發現?」 這不是孤立案例。根據 OWASP (Open Web Application Security Project) 的統計,業務邏輯漏洞佔所有嚴重安全問題的 15% 至 20%,但它們極少被自動化工具偵測到,因為這類問題需要理解應用程式的「預期行為」與「實際行為」之間的差距——這正是傳統工具的盲點。當企業將安全檢查推遲到開發後期或部署前夕,發現問題時往往已經投入大量資源,修復成本與時間壓力都會倍增。AWS 推出的 AWS Security Agent 正
hktechblog
4天前讀畢需時 10 分鐘

淺談 Amazon 郵件誤寄事件及如何透過 Email DLP 避免寄錯信件
近日,Amazon 不小心洩漏了禮品卡訂單確認電子郵件,將 Google Play、Hotels.com 和 Mastercard 的禮品卡訂單資訊發送給了錯誤的收件人。

bottom of page