top of page

Claude 3.5 Sonnet 隆重推出 價錢僅 Claude 3 Opus 5份1 基準測試撼嬴市面多個大模型

  • hktechblog
  • 2024年6月25日
  • 讀畢需時 2 分鐘

Anthropic 於近日宣佈推出3.5 Sonnet,為全新 Claude 3.5系列中推出的第一個版本。而 Amazon Bedrock 現已提供 Claude 3.5 Sonnet 予客戶使用。Claude 3.5 Sonnet 的推出將提升了業界的智能標準,其在廣泛的評估中都比其他生成式 AI 模型優勝,包括 Anthropic 之前最優秀的模型 Claude 3 Opus。 Claude 3.5 Sonnet 的速度和成本都與前一版本 Claude 3 Sonnet 模型相同,但僅需 5 份之 1 的價錢獲得比 Claude 3 Opus 更好的效果和速度,完美實現低成本,高效益。下圖為最新 Sonnet 模型與上一版 Claude 3 家族表現與成本比較:

 


Claude 3.5 Sonnet 為學士級專家知識 (MMLU)、研究生級專家推理 (GPQA)、程式編寫能力 (HumanEval) 等訂下了新的行業基準。如下圖 Anthropic 數據所示,Claude 3.5 Sonnet 幾乎在所有基準測試中都比 OpenAI 的 GPT-4o 和 Google 的 Gemini 1.5 Pro 更勝一籌。


Claude 3.5 Sonnet 亦是 Anthropic 迄今最強的視覺模型,在大多數視覺基準測試中,表現平均比 Claude 3 Opus 高出 10%。據 Anthropic 稱,Claude 3.5 Sonnet 幾乎在每個類別中都優於其他生成式 AI 模型。


Antropic 在發佈 Claude 3.5 Sonnet 模型的同時亦準備了附錄,提供更多模型表現數據。3.5 Sonnet 能在長文本的情況下準確記憶內容,上下文表現幾乎完勝過往所有模型,更能處理複雜問題。它在處理行業問題如金融、法律、醫學等,以及處理特定任務如編寫程式、創意寫作等,都完勝過往模型。數據詳見下圖:

 

根據 AI 模型表現比較網站 ArtificialAnalysis,Claude 3.5 Sonnet 輸出 token 速度亦較競爭對手 GPT-4o 及 Gemini 1.5 Pro 優勝。


隨著今次 Claude 模型新版本推出,AI 大模型競爭將更趨白熱化。無論企業和個人都將會是受惠者,能以更低廉價錢使用表現更強勁的 AI 模型。立即在 Amazon Bedrock 選用 Claude 3.5 Sonnet,讓 AI 分擔繁重工作。

 

 
 
 

Comments

Rated 0 out of 5 stars.
No ratings yet

Add a rating
bottom of page