top of page
  • hktechblog

Amazon Bedrock x Claude 3 Sonnet 解鎖最強生成式AI應用

Amazon Web Service(AWS)早前與AI企業Anthropic合作,在旗下全託管AI平臺Amazon Bedrock支援最新推出的Claude 3 Sonnet模型,為使用者帶來更靈活、更快的生成式AI效能。

Claude3系列設有三個模型,分別名為「Haiku」、「Sonnet」及「Opus」,三者之間在效能、適用場景及使用成本方面有一定的差異,能夠適用於不同場景的需求。其中位列中等級別的Sonnet在效能、智能性、推理速度及成本達致平衡,適合大部分日常及商業應用場景。

配備200k超長上下文視窗,以及全面而強大的檢索及生成功能(RAG),Claude 3系列能夠有效處理長文檔及進行分析與生成,有利於需要利用生成式AI進行創意寫作或市場營銷的企業。


有使用者分別要求Claude 3三個模型以同樣的故事前提設計角色,並為他們賦予名字及細節,並以指定風格寫出14個場景,以測試三者之間在創意方面的表現。測試結果發現,無論是Haiku、Sonnet或Opus,都能夠生成高品質的場景大綱,在寫作質量上未見太大差異。然而,當涉及更細緻的創作要求,例如為角色命名,Sonnet及Opus就能生成更具一致性的答案,並建立更多細節,對於需要豐富層次的創作更為有利。此外,相較於Opus注重故事的複雜程度,Sonnet在創造具情感變化及現代感的對話上則更具優勢。這亦體現於創作具感染力廣告標語的效果,在另一項測試中,Sonnet的生成結果比Haiku及 Opus更能理解市場營銷策略背後的複雜性,創作更吸引及具效果的標語。


另一方面,編程能力同樣是衡量AI模型效能的關鍵指標之一。透過專為生成式AI編程能力而設的基準測試HumanEval,不論Haiku(75.9%)、Sonnet(73%)或Opus(84.9%)的效能都比GPT-4(67%)為高。


有使用者就對Claude 3的三個模型進行編寫Python貪食蛇遊戲測試,結果發現儘管Opus能夠在基本遊戲以外,生成額外遊戲機制及交互元素等複雜編碼,Sonnet卻能夠以平均每秒56.68個Token的高速度完成基本編程任務,比起平均每秒21.875個Token的Opus高出兩倍,而且生成的代碼易於複製和直接使用,在成本更低的前提下,同樣能夠為用戶提供流暢及可靠的編程體驗,在速度及輸出品質上達致更佳平衡。


除創作及編程能力外,Claude 3亦進一步加強影像理解效能。三個模型在ANLS(文檔影像對答)、AI2D(科學圖表)及Relaxed Accuracy(圖表對答)等基準測試上,都錄得比GPT-4及Gemini 1.0 Pro更出色的表現,其中Sonnet在科學圖表測試上的結果更在眾多模型中首屈一指,足以應對使用者大量處理圖表、分析報告等視覺數據的需求。


有專家曾對Amazon Bedrock上的Sonnet進行視覺測試,其中透過展示兩張近乎相同的圖片,讓模型描述當中的差異,結果Sonnet能夠準確描述相異之處的位置、形狀和大小,效果令人滿意。專家亦進行工藝流程圖(P&ID)與AWS參考架構圖測試,結果在了解過相關文檔的上下文資訊後,Sonnet同樣能夠作出快速而準確的解讀。


在坊間眾多生成式AI的測試與比較中,Claude 3三個模型的表現同樣可圈可點,當中尤以功能最強大的Opus更適用於處理複雜的流程,然而其每百萬Tokens的輸入和輸出成本分別為15美元和75美元,對於資金有限的使用者無疑較大負擔。相比之下,擁有比Haiku更佳效能、與GPT-4智能水平相若的Sonnet,每百萬Tokens輸入和輸出成本僅為3美元和15美元,在效能及成本之間取得平衡,適合大規模AI部署。


受惠於AWS雲端技術的完善的計算能力,Claude 3 Sonnet在Amazon Bedrock上的應用將具備更快、更流暢的效能,同時透過VPC網路隔離、數據加密等嚴格的安全機制,將有助企業保護數據及機密資料,消除隱私外洩疑慮,讓企業更無後顧之憂地部署及應用生成式AI,帶來無窮無盡的可能性。


0 次查看0 則留言
bottom of page