top of page

使用 DeepSeek-R1、CrewAI 和 Amazon SageMaker AI 構建智能代理解決方案

  • hktechblog
  • 4月9日
  • 讀畢需時 4 分鐘
ree

AI 代理正迅速成為企業轉型的下一個前沿。根據 Capgemini 的調查,82% 的組織計劃在未來三年內採用 AI 代理,10% 的組織已經使用 AI 代理,超過一半的組織計劃在未來一年內使用。最近發布的 DeepSeek-R1 模型為開源社區帶來了最新的推理能力,組織可以使用這些模型構建智能應用,執行複雜任務,提升效率和適應性。

在這篇文章中,我們將展示如何使用 Amazon SageMaker AI —— 一個完全管理的服務,讓您能夠大規模構建、訓練和部署機器學習模型,並使用 CrewAI(一個流行的智能代理框架)和開源模型如 DeepSeek-R1 來構建 AI 代理。

智能設計 vs. 傳統軟件設計

智能系統與傳統軟件在處理複雜、動態和領域特定挑戰方面提供了根本不同的方法。智能系統由大型語言模型(LLMs)驅動,可以自主運行,從環境中學習,並做出微妙、上下文感知的決策。這是通過模塊化組件來實現的,包括推理、記憶、認知技能和工具,使它們能夠執行複雜任務並適應變化的場景。

傳統軟件平台雖然在處理例行任務和水平擴展方面非常有效,但通常缺乏智能系統提供的領域特定智能和靈活性。例如,在製造環境中,傳統系統可能會跟踪庫存,但缺乏預測供應鏈中斷或使用即時市場見解優化採購的能力。相比之下,智能系統可以處理實時數據,如庫存波動、客戶偏好和環境因素,主動調整策略並在中斷期間重新路由供應鏈。

企業應該戰略性地考慮在需要適應性和領域特定專業知識的情況下部署智能系統。例如,考慮客戶服務。傳統聊天機器人僅限於對預設客戶查詢的預編程回應,但 AI 代理可以使用自然語言與客戶互動,提供個性化幫助,並更有效地解決查詢。AI 代理可以通過自動化重複任務(如生成報告、電子郵件和軟件代碼)來顯著提高生產力。智能系統的部署應集中在具有明確成功指標的定義過程中,並且在流程管理中具有更大靈活性和更少僵化的潛力。

DeepSeek-R1

在這篇文章中,我們將展示如何將 DeepSeek-R1 部署到 SageMaker,特別是 Llama-70b 濃縮變體 DeepSeek-R1-Distill-Llama-70B 到 SageMaker 實時端點。DeepSeek-R1 是由 AI 初創公司 DeepSeek 開發的先進 LLM,它使用強化學習技術來增強其推理能力,使其能夠執行複雜任務,如數學問題解決和編碼。要了解更多關於 DeepSeek-R1 的信息,請參考 DeepSeek-R1 模型現已在 Amazon Bedrock Marketplace 和 Amazon SageMaker JumpStart 上提供,並深入了解構建 DeepSeek-R1 背後的理論。

在 SageMaker AI 上的生成 AI

SageMaker AI 是一個完全管理的服務,提供一套全面的工具,旨在為多種用途提供高性能、成本效益的機器學習(ML)和生成 AI 解決方案。SageMaker AI 使您能夠通過一系列服務(包括筆記本、作業、托管、實驗跟踪、精選模型中心和 MLOps 功能)在統一的集成開發環境(IDE)中構建、訓練、部署、監控和管理 ML 和生成 AI 模型。

SageMaker AI 簡化了生成 AI 模型構建者的所有技能水平的流程,以便與基礎模型(FMs)一起使用:

  • Amazon SageMaker Canvas 使數據科學家能夠無縫地使用其自有數據集與 FMs 一起創建應用程序和架構模式(如聊天機器人和檢索增強生成(RAG)),在低代碼或無代碼環境中。

  • Amazon SageMaker JumpStart 提供了來自提供商(如 Hugging Face、Meta 和 Stability AI)的開放和專有 FMs 的多樣選擇。您可以通過直觀的用戶界面或 API 部署或微調模型,提供所有技能水平的靈活性。

  • SageMaker AI 功能(如筆記本、Amazon SageMaker Training、推理、Amazon SageMaker for MLOps 和合作夥伴 AI 應用程序)使高級模型構建者能夠使用 LoRA、完全微調或從頭開始訓練來適應 FMs。這些服務支持從單個 GPU 到 HyperPods(GPU 集群)的訓練,並包括用於跟踪、調試和部署的內置 FMOps 工具。

 

 

解決方案概述


ree

CrewAI 提供了一個強大的框架,用於開發與 AWS 服務集成的多代理系統,特別是 SageMaker AI。該框架在工作流程編排方面表現出色,並保持與 AWS 最佳實踐相一致的企業級安全標準,使其成為在 AWS 基礎設施中實施複雜代理系統的有效解決方案。


如何開始

要遵循本文中的代碼示例,請確保滿足以下先決條件:

  • 集成開發環境 – 包括訪問 Amazon SageMaker Studio 和 JupyterLab IDE。

  • 部署模型的權限 – 確保您的用戶執行角色具有將模型部署到 SageMaker 實時端點的必要權限。

  • 訪問 Hugging Face Hub – 確保您能夠訪問 Hugging Face Hub 的 DeepSeek-R1 模型權重。

  • 在編排智能工作流程之前,首先需要托管和查詢 LLM。您可以從 SageMaker JumpStart 或 Hugging Face Hub 部署 LLMs。

·         完成後,請刪除您的 GPU 端點並關閉 JupyterLab 筆記本實例。



想了解更多關於如何使用 AWS 構建智能代理解決方案的信息,請閱讀我們的 AWS Blog


 
 
 

最新文章

查看全部
AWS推向量儲存服務 S3 Vectors正式上線強化AI應用基礎設施

提升規模與效能 為生成式AI和機器學習提供高效向量搜尋能力 生成式AI的興起帶動了向量嵌入(Vector Embeddings)技術的廣泛應用。從智能搜尋、推薦系統到檢索增強生成(RAG),向量嵌入已成為現代AI應用的核心技術。然而,隨著應用規模的擴大,如何高效地儲存和搜尋數十億甚至數兆個向量,成為企業面臨的重大挑戰。傳統的向量資料庫雖然提供了搜尋能力,但在規模、成本和管理複雜度方面都存在限制。亞

 
 
 
AWS強化安全管理中樞 Security Hub新增即時分析與風險優先排序

正式版推出進階功能 協助企業更有效管理雲端安全態勢 資安團隊每天面對數以千計的安全告警,從配置錯誤、漏洞偵測到異常活動,各種警報不斷湧入。然而,並非所有告警都同等重要。在這片告警的海洋中,如何快速識別真正需要立即處理的關鍵風險,成為資安團隊的重大挑戰。延遲處理高風險問題可能導致嚴重後果,但過度關注低風險告警又會浪費寶貴資源。亞馬遜雲端服務(AWS)正式推出的AWS Security Hub新版本,

 
 
 
AWS推出Route 53全球解析器:革新企業DNS架構的安全解決方案

企業數位轉型的過程中,網域名稱系統(DNS)扮演著關鍵角色。每當使用者輸入網址或應用程式發出請求時,DNS就像網際網路的電話簿,將人類可讀的網域名稱轉換為機器可識別的IP位址。然而,隨著企業規模擴大、應用程式分散在多個雲端環境和地區,傳統DNS架構面臨著效能、安全性和管理複雜度的多重挑戰。亞馬遜雲端服務(AWS)近日宣布推出Amazon Route 53 Global Resolver預覽版,為企

 
 
 

留言

評等為 0(最高為 5 顆星)。
暫無評等

新增評等
bottom of page