使用 DeepSeek-R1、CrewAI 和 Amazon SageMaker AI 構建智能代理解決方案

hktechblog
2025年4月9日
讀畢需時 4 分鐘

AI 代理正迅速成為企業轉型的下一個前沿。根據 Capgemini 的調查，82% 的組織計劃在未來三年內採用 AI 代理，10% 的組織已經使用 AI 代理，超過一半的組織計劃在未來一年內使用。最近發布的 DeepSeek-R1 模型為開源社區帶來了最新的推理能力，組織可以使用這些模型構建智能應用，執行複雜任務，提升效率和適應性。

在這篇文章中，我們將展示如何使用 Amazon SageMaker AI —— 一個完全管理的服務，讓您能夠大規模構建、訓練和部署機器學習模型，並使用 CrewAI（一個流行的智能代理框架）和開源模型如 DeepSeek-R1 來構建 AI 代理。

智能設計 vs. 傳統軟件設計

智能系統與傳統軟件在處理複雜、動態和領域特定挑戰方面提供了根本不同的方法。智能系統由大型語言模型（LLMs）驅動，可以自主運行，從環境中學習，並做出微妙、上下文感知的決策。這是通過模塊化組件來實現的，包括推理、記憶、認知技能和工具，使它們能夠執行複雜任務並適應變化的場景。

傳統軟件平台雖然在處理例行任務和水平擴展方面非常有效，但通常缺乏智能系統提供的領域特定智能和靈活性。例如，在製造環境中，傳統系統可能會跟踪庫存，但缺乏預測供應鏈中斷或使用即時市場見解優化採購的能力。相比之下，智能系統可以處理實時數據，如庫存波動、客戶偏好和環境因素，主動調整策略並在中斷期間重新路由供應鏈。

企業應該戰略性地考慮在需要適應性和領域特定專業知識的情況下部署智能系統。例如，考慮客戶服務。傳統聊天機器人僅限於對預設客戶查詢的預編程回應，但 AI 代理可以使用自然語言與客戶互動，提供個性化幫助，並更有效地解決查詢。AI 代理可以通過自動化重複任務（如生成報告、電子郵件和軟件代碼）來顯著提高生產力。智能系統的部署應集中在具有明確成功指標的定義過程中，並且在流程管理中具有更大靈活性和更少僵化的潛力。

DeepSeek-R1

在這篇文章中，我們將展示如何將 DeepSeek-R1 部署到 SageMaker，特別是 Llama-70b 濃縮變體 DeepSeek-R1-Distill-Llama-70B 到 SageMaker 實時端點。DeepSeek-R1 是由 AI 初創公司 DeepSeek 開發的先進 LLM，它使用強化學習技術來增強其推理能力，使其能夠執行複雜任務，如數學問題解決和編碼。要了解更多關於 DeepSeek-R1 的信息，請參考 DeepSeek-R1 模型現已在 Amazon Bedrock Marketplace 和 Amazon SageMaker JumpStart 上提供，並深入了解構建 DeepSeek-R1 背後的理論。

在 SageMaker AI 上的生成 AI

SageMaker AI 是一個完全管理的服務，提供一套全面的工具，旨在為多種用途提供高性能、成本效益的機器學習（ML）和生成 AI 解決方案。SageMaker AI 使您能夠通過一系列服務（包括筆記本、作業、托管、實驗跟踪、精選模型中心和 MLOps 功能）在統一的集成開發環境（IDE）中構建、訓練、部署、監控和管理 ML 和生成 AI 模型。

SageMaker AI 簡化了生成 AI 模型構建者的所有技能水平的流程，以便與基礎模型（FMs）一起使用：

Amazon SageMaker Canvas 使數據科學家能夠無縫地使用其自有數據集與 FMs 一起創建應用程序和架構模式（如聊天機器人和檢索增強生成（RAG）），在低代碼或無代碼環境中。
Amazon SageMaker JumpStart 提供了來自提供商（如 Hugging Face、Meta 和 Stability AI）的開放和專有 FMs 的多樣選擇。您可以通過直觀的用戶界面或 API 部署或微調模型，提供所有技能水平的靈活性。
SageMaker AI 功能（如筆記本、Amazon SageMaker Training、推理、Amazon SageMaker for MLOps 和合作夥伴 AI 應用程序）使高級模型構建者能夠使用 LoRA、完全微調或從頭開始訓練來適應 FMs。這些服務支持從單個 GPU 到 HyperPods（GPU 集群）的訓練，並包括用於跟踪、調試和部署的內置 FMOps 工具。

解決方案概述