Large language model已經進入「實用」時代
- hktechblog
- 2024年6月5日
- 讀畢需時 4 分鐘

在雲端運算領域競爭最激烈的時代,AWS曾提出,雲端運算的普惠是技術升級帶來的。這個說法換到現今的生成式 AI 時代也是成立的。 如果細數這半年來「震撼發布」、「顛覆時代」出現的頻率,其實並不比往年低。每一次Update都在抬高大模型解決問題能力的上限,也都拓展了人們關於如何利用大模型解決現實場景問題的視野。 前段時間,Claude 3 高調面世,一度打破 GPT-4 保持了許久的全球最強大模型紀錄 。 Claude 3 的背後,站著 Anthropic 的深度合作夥伴 —— AWS。
經過Amazon Bedrock 上的Claude 3 與微軟Azure GPT4 相關測試,假定6:1 的輸入輸出比,Claude 3 Sonnet 成本僅為GPT4-Turbo 的37%,Claude 3 Haiku 成本僅為GPT3.5-Turbo 的61 %。 成本的大幅降低,並不意味著性能方面的犧牲。由於硬體和軟體的最佳化,Amazon Bedrock 上的 Claude 3 模型的即時互動速度顯著加快。
此外,透過大規模擴展以及新的自監督技術,Claude 3 上下文中複雜問題的準確性預期也提高了 2 倍,這意味著人工智慧更加有用、安全和誠實。 2024 年即將過半,大模型賽道越來越捲,廠商們又該憑藉什麼如何留住用戶?
AWS的秘訣是什麼? 科技進步的同時,使用者的需求也在進化。
在AWS中國峰會上,我們再次看到了這家公司的一系列新思考。 全球 80% 獨角獸的選擇 Amazon Bedrock 有哪些優勢?
在現實場景中,沒有一個模型能適用於所有用例,也不會有一個大模型能「一統天下」。對於那些急需使用大模型重做業務的企業來說,最理想的存取方式是透過一個 API 存取不同模型,根據自己的業務需求做出最佳選擇。 大模型落地的範圍越廣、程度越深,企業用戶就越能感受到這一點。
上述需求客觀存在,就是 Amazon Bedrock 維持核心優勢的背景之一。在AWS的三層生成式 AI 技術堆疊中,Amazon Bedrock 位於其中的「工具層」。而且與多數提供大模型 API 服務的廠商不同,AWS起初將 Amazon Bedrock 設計為一位「全能選手」。

截至目前,Amazon Bedrock 提供的基礎模型數量已經達到了 30 個,且都是來自 AI21 Labs、Anthropic、Cohere、Meta、Stability AI 、Mistral AI 等頂尖的大模型廠商。在功能上,這些基礎模型涵蓋了文字生成、虛擬助理、文字和圖片檢索、文字摘要、圖片生成等;在場景上,涵蓋了翻譯、智慧運作、角色扮演、創意寫作、智慧教輔、智慧辦公、客戶服務、審核風控、智慧開發、視訊VQA 這十大常見應用,涉及社交、遊戲、電商、零售、教育、製造等多個行業。
可以說,目前最新、最前衛的一批模型,都在 Amazon Bedrock。

如果大致對比今年 Amazon Bedrock 的上新,可以看出,今年 Amazon Bedrock 的「上新」動作,明顯有著企業級負載的特色: 以 Claude 3 為例,系列包含三個模型,延續了 Claude 系列的傳統強項 —— 長上下文窗口,初始階段即支援 200K Token 上下文窗口。 相較於 Claude 3 Opus 的「最聰明」和 Claude 3 Haiku 的「速度最快、最緊湊」,Claude 3 Sonnet 在智能程度與運行速度之間實現了理想的平衡。尤其是對於企業工作負載而言,與同類模型相比,Claude 3 Sonnet 以更低的成本提供了強大的性能,並專為大規模AI 部署中的高耐用性而設計—— 這對於企業用例來說非常重要。 基於AWS與 Anthropic「深厚」的合作關係,Amazon Bedrock 成為了第一個提供 Claude 3 Sonnet 託管服務的平台。後續登陸 Amazon Bedrock 的 Cohere 基礎模型 Command R 和 Command R+ 也都是強大且可擴展的大型語言模型(LLM),專為現實世界的企業級工作負載而設計。 Amazon Bedrock 今年也迎來了一位全新的進駐廠商,就是有「歐洲版 OpenAI」之稱的 Mistral AI 。
這家公司將旗下最強大的Mistral Large 發佈到Amazon Bedrock,Mistral Large 語言理解和生成能力很強,非常適合需要推理能力或高度專門化的複雜任務,如合成文本生成、代碼生成、檢索增強生成(RAG)或智能代理。
同時,Mistral AI 也承諾AWS的使用者可以使用和存取 Mistral AI 未來發布的大型模型。 當然,現實場景何其複雜,任何平台都無法保證自己能夠提供使用者所有所需的大模型,在這個過程中,使用者還需要更高的「彈性」。
因此,Amazon Bedrock 提供了根據業務需求客製化生成式 AI 的功能 ——「自訂模型導入」。 對於已經對 LLM 進行了大量微調或想要從頭開始訓練自訂模型的用戶,這是一個很好的選項 。例如,用戶可以將自己在Amazon SageMaker 或其他工具上的客製化模型「搬運」過來,至少Amazon SageMaker 就提供了超過250 個預訓練基礎模型,如Mistral、Llama2、CodeLlama、Jurassic-2、Jamba、pplx- 7B、70B 和Falcon 180B。
在這場峰會上,亞馬遜雲科技也公佈了一個重磅消息:由百川智能提供的基礎模型Baichuan2-7B 即將登陸中國區域SageMaker JumpStart ,由零一萬物提供的基礎模型Yi-1.5 6B/9B/ 34B 正式登陸中國區域SageMaker JumpStart ,在為中國企業提供豐富模型選擇的同時滿足了企業對安全合規、快速擴展、免運維的需求。

作為首批登陸中國區域 SageMaker JumpStart 的中文基礎模型,Baichuan2 和 Yi-1.5 與AWS託管服務深度集成,協助中國企業應用一流的生成式 AI 技術實現本土創新與業務轉型。
這意味著用戶可以將自己在更豐富的開源模型架構上建立的自訂模型。隨著本土開源大模型鼎盛時期的到來,未來必將會有更多來自中國大模型企業的基礎模型登陸AWS的平台,用戶也能靈活調用這些中文能力更強大的模型基座。
轉自: 機器之心
Comments