Claude 3.5 Sonnet 隆重推出價錢僅 Claude 3 Opus 5份1 基準測試撼嬴市面多個大模型

hktechblog
2024年6月25日
讀畢需時 2 分鐘

Anthropic 於近日宣佈推出3.5 Sonnet，為全新 Claude 3.5系列中推出的第一個版本。而 Amazon Bedrock 現已提供 Claude 3.5 Sonnet 予客戶使用。Claude 3.5 Sonnet 的推出將提升了業界的智能標準，其在廣泛的評估中都比其他生成式 AI 模型優勝，包括 Anthropic 之前最優秀的模型 Claude 3 Opus。 Claude 3.5 Sonnet 的速度和成本都與前一版本 Claude 3 Sonnet 模型相同，但僅需 5 份之 1 的價錢獲得比 Claude 3 Opus 更好的效果和速度，完美實現低成本，高效益。下圖為最新 Sonnet 模型與上一版 Claude 3 家族表現與成本比較:

Claude 3.5 Sonnet 為學士級專家知識 (MMLU)、研究生級專家推理 (GPQA)、程式編寫能力 (HumanEval) 等訂下了新的行業基準。如下圖 Anthropic 數據所示，Claude 3.5 Sonnet 幾乎在所有基準測試中都比 OpenAI 的 GPT-4o 和 Google 的 Gemini 1.5 Pro 更勝一籌。

Claude 3.5 Sonnet 亦是 Anthropic 迄今最強的視覺模型，在大多數視覺基準測試中，表現平均比 Claude 3 Opus 高出 10%。據 Anthropic 稱，Claude 3.5 Sonnet 幾乎在每個類別中都優於其他生成式 AI 模型。

Antropic 在發佈 Claude 3.5 Sonnet 模型的同時亦準備了附錄，提供更多模型表現數據。3.5 Sonnet 能在長文本的情況下準確記憶內容，上下文表現幾乎完勝過往所有模型，更能處理複雜問題。它在處理行業問題如金融、法律、醫學等，以及處理特定任務如編寫程式、創意寫作等，都完勝過往模型。數據詳見下圖:

根據 AI 模型表現比較網站 ArtificialAnalysis，Claude 3.5 Sonnet 輸出 token 速度亦較競爭對手 GPT-4o 及 Gemini 1.5 Pro 優勝。

隨著今次 Claude 模型新版本推出，AI 大模型競爭將更趨白熱化。無論企業和個人都將會是受惠者，能以更低廉價錢使用表現更強勁的 AI 模型。立即在 Amazon Bedrock 選用 Claude 3.5 Sonnet，讓 AI 分擔繁重工作。

HK TECH BLOG

Claude 3.5 Sonnet 隆重推出價錢僅 Claude 3 Opus 5份1 基準測試撼嬴市面多個大模型

最新文章

留言