Amazon Bedrock x Claude 3 Sonnet 解鎖最強生成式AI應用

hktechblog
2024年4月27日
讀畢需時 3 分鐘

Amazon Web Service（AWS）早前與AI企業Anthropic合作，在旗下全託管AI平臺Amazon Bedrock支援最新推出的Claude 3 Sonnet模型，為使用者帶來更靈活、更快的生成式AI效能。

Claude3系列設有三個模型，分別名為「Haiku」、「Sonnet」及「Opus」，三者之間在效能、適用場景及使用成本方面有一定的差異，能夠適用於不同場景的需求。其中位列中等級別的Sonnet在效能、智能性、推理速度及成本達致平衡，適合大部分日常及商業應用場景。

配備200k超長上下文視窗，以及全面而強大的檢索及生成功能（RAG），Claude 3系列能夠有效處理長文檔及進行分析與生成，有利於需要利用生成式AI進行創意寫作或市場營銷的企業。

有使用者分別要求Claude 3三個模型以同樣的故事前提設計角色，並為他們賦予名字及細節，並以指定風格寫出14個場景，以測試三者之間在創意方面的表現。測試結果發現，無論是Haiku、Sonnet或Opus，都能夠生成高品質的場景大綱，在寫作質量上未見太大差異。然而，當涉及更細緻的創作要求，例如為角色命名，Sonnet及Opus就能生成更具一致性的答案，並建立更多細節，對於需要豐富層次的創作更為有利。此外，相較於Opus注重故事的複雜程度，Sonnet在創造具情感變化及現代感的對話上則更具優勢。這亦體現於創作具感染力廣告標語的效果，在另一項測試中，Sonnet的生成結果比Haiku及 Opus更能理解市場營銷策略背後的複雜性，創作更吸引及具效果的標語。

另一方面，編程能力同樣是衡量AI模型效能的關鍵指標之一。透過專為生成式AI編程能力而設的基準測試HumanEval，不論Haiku（75.9%）、Sonnet（73%）或Opus（84.9%）的效能都比GPT-4（67%）為高。

有使用者就對Claude 3的三個模型進行編寫Python貪食蛇遊戲測試，結果發現儘管Opus能夠在基本遊戲以外，生成額外遊戲機制及交互元素等複雜編碼，Sonnet卻能夠以平均每秒56.68個Token的高速度完成基本編程任務，比起平均每秒21.875個Token的Opus高出兩倍，而且生成的代碼易於複製和直接使用，在成本更低的前提下，同樣能夠為用戶提供流暢及可靠的編程體驗，在速度及輸出品質上達致更佳平衡。

除創作及編程能力外，Claude 3亦進一步加強影像理解效能。三個模型在ANLS（文檔影像對答）、AI2D（科學圖表）及Relaxed Accuracy（圖表對答）等基準測試上，都錄得比GPT-4及Gemini 1.0 Pro更出色的表現，其中Sonnet在科學圖表測試上的結果更在眾多模型中首屈一指，足以應對使用者大量處理圖表、分析報告等視覺數據的需求。

有專家曾對Amazon Bedrock上的Sonnet進行視覺測試，其中透過展示兩張近乎相同的圖片，讓模型描述當中的差異，結果Sonnet能夠準確描述相異之處的位置、形狀和大小，效果令人滿意。專家亦進行工藝流程圖（P＆ID）與AWS參考架構圖測試，結果在了解過相關文檔的上下文資訊後，Sonnet同樣能夠作出快速而準確的解讀。

在坊間眾多生成式AI的測試與比較中，Claude 3三個模型的表現同樣可圈可點，當中尤以功能最強大的Opus更適用於處理複雜的流程，然而其每百萬Tokens的輸入和輸出成本分別為15美元和75美元，對於資金有限的使用者無疑較大負擔。相比之下，擁有比Haiku更佳效能、與GPT-4智能水平相若的Sonnet，每百萬Tokens輸入和輸出成本僅為3美元和15美元，在效能及成本之間取得平衡，適合大規模AI部署。

受惠於AWS雲端技術的完善的計算能力，Claude 3 Sonnet在Amazon Bedrock上的應用將具備更快、更流暢的效能，同時透過VPC網路隔離、數據加密等嚴格的安全機制，將有助企業保護數據及機密資料，消除隱私外洩疑慮，讓企業更無後顧之憂地部署及應用生成式AI，帶來無窮無盡的可能性。

HK TECH BLOG

Amazon Bedrock x Claude 3 Sonnet 解鎖最強生成式AI應用

最新文章

Comments