top of page

Amazon Bedrock SLA保障再升級:DeepSeek-R1全託管無伺服器模型正式加入

  • hktechblog
  • 4月17日
  • 讀畢需時 3 分鐘
ree

AWS日前宣布,DeepSeek-R1模型現已在Amazon Bedrock上作為全託管無伺服器(fully managed serverless)模型正式推出,納入其服務等級協議(SLA)保障範圍,為企業用戶提供更多元化且穩定可靠的生成式AI選擇。自2025年1月30日透過Amazon Bedrock Marketplace和Amazon Bedrock Custom Model Import提供DeepSeek-R1模型以來,已有數千名客戶在Amazon Bedrock上部署這些模型。如今,AWS成為首家將DeepSeek-R1作為全託管模型正式提供的雲端服務供應商。


服務等級協議全面覆蓋DeepSeek-R1

ree

此次DeepSeek-R1全託管模型的加入,意味著該模型將享有與其他Amazon Bedrock模型相同的SLA保障。根據Amazon Bedrock SLA,AWS承諾每月服務可用性達99.9%,若服務未達標準,用戶可獲得相應的服務抵免額:當每月正常運行時間百分比低於99.9%但大於或等於99.0%時,可獲得10%的服務抵免額;若低於99.0%但大於或等於95.0%,則可獲得25%的抵免額;若低於95.0%,將獲得高達100%的服務抵免額。


DeepSeek-R1以其在推理、編碼和自然語言理解方面的強大能力而聞名,這些能力能夠支援智能決策支援、軟體開發、數學問題解決、科學分析、資料洞察以及全面的知識管理系統。該模型在MIT授權下公開可用,專為企業級應用而設計。


企業級安全與責任AI(Responsible AI)特性完整保留

ree

在Amazon Bedrock上使用DeepSeek-R1時,企業用戶能夠獲得:

  1. 資料安全保障 — 用戶可存取Amazon Bedrock的企業級安全、監控和成本控制功能,這些功能對於大規模負責任地部署AI至關重要,同時保持對資料的完全控制。用戶的輸入和模型輸出不會與任何模型提供者共享。與DeepSeek-R1模型通信時,默認情況下可使用靜態和傳輸中資料加密、細粒度訪問控制、安全連接選項等關鍵安全功能,並可下載各種合規認證。

  2. 負責任AI功能 (Responsible AI) — 用戶可使用Amazon Bedrock Guardrails實施根據應用需求和負責任AI政策定制的保護措施,包括內容過濾、敏感信息過濾,以及使用情境扎根(contextual grounding)和自動推理檢查來防止幻覺的可定制安全控制。這意味著用戶可以通過過濾生成式AI應用中不良和有害內容,使用自定義政策集控制用戶與Bedrock中DeepSeek-R1模型的互動。

  3. 模型評估工具 — 用戶可以通過自動或人工評估,使用Amazon Bedrock模型評估工具在幾個步驟中評估和比較包括DeepSeek-R1在內的模型,找出最適合使用案例的模型。可以選擇使用預定義指標(如準確性、穩健性和毒性)進行自動評估,或者選擇人工評估工作流程來評估主觀或自定義指標(如相關性、風格和與品牌聲音的一致性)。


SLA保障與先進模型結合的企業級服務

技術分析專家指出,Amazon Bedrock SLA對DeepSeek-R1的覆蓋,代表著AWS持續提升其生成式AI服務的企業級保障。「SLA的存在不僅是服務品質的承諾,更是企業客戶在生產環境部署生成式AI應用的信心來源,」某資訊安全專家表示,「尤其是當這些SLA保障延伸到如DeepSeek-R1這樣新納入的先進模型時,企業能夠在不犧牲穩定性的前提下嘗試最新技術。」

金融科技行業的系統架構師則補充道:「在決定使用哪個生成式AI平台時,既有SLA保障又能提供多樣化模型選擇的服務顯然更具吸引力。Amazon Bedrock新增DeepSeek-R1到其受SLA保障的模型陣容中,讓我們能夠安心探索這個模型在程式碼生成和數據分析方面的優勢。」

企業現在可以透過Amazon Bedrock,以單一API訪問包括DeepSeek-R1在內的多種先進生成式AI模型,同時獲得完整的服務等級保證,無需擔心基礎架構複雜性,專注於創新並實現切實的業務價值。


如需了解有關Amazon Bedrock上DeepSeek-R1全託管模型及其SLA保障的更多資訊,企業可訪問AWS官方網站或聯繫其AWS客戶團隊


 
 
 

最新文章

查看全部
AWS推向量儲存服務 S3 Vectors正式上線強化AI應用基礎設施

提升規模與效能 為生成式AI和機器學習提供高效向量搜尋能力 生成式AI的興起帶動了向量嵌入(Vector Embeddings)技術的廣泛應用。從智能搜尋、推薦系統到檢索增強生成(RAG),向量嵌入已成為現代AI應用的核心技術。然而,隨著應用規模的擴大,如何高效地儲存和搜尋數十億甚至數兆個向量,成為企業面臨的重大挑戰。傳統的向量資料庫雖然提供了搜尋能力,但在規模、成本和管理複雜度方面都存在限制。亞

 
 
 
AWS強化安全管理中樞 Security Hub新增即時分析與風險優先排序

正式版推出進階功能 協助企業更有效管理雲端安全態勢 資安團隊每天面對數以千計的安全告警,從配置錯誤、漏洞偵測到異常活動,各種警報不斷湧入。然而,並非所有告警都同等重要。在這片告警的海洋中,如何快速識別真正需要立即處理的關鍵風險,成為資安團隊的重大挑戰。延遲處理高風險問題可能導致嚴重後果,但過度關注低風險告警又會浪費寶貴資源。亞馬遜雲端服務(AWS)正式推出的AWS Security Hub新版本,

 
 
 
AWS推出Route 53全球解析器:革新企業DNS架構的安全解決方案

企業數位轉型的過程中,網域名稱系統(DNS)扮演著關鍵角色。每當使用者輸入網址或應用程式發出請求時,DNS就像網際網路的電話簿,將人類可讀的網域名稱轉換為機器可識別的IP位址。然而,隨著企業規模擴大、應用程式分散在多個雲端環境和地區,傳統DNS架構面臨著效能、安全性和管理複雜度的多重挑戰。亞馬遜雲端服務(AWS)近日宣布推出Amazon Route 53 Global Resolver預覽版,為企

 
 
 

留言

評等為 0(最高為 5 顆星)。
暫無評等

新增評等
bottom of page