Palmyra X5 是專為高效驅動多步驟 agents 而開發的模型,現僅可通過 Writer 和 Amazon Bedrock 以完全托管的方式提供。
北京 2025年4月29日 /美通社/ -- 亞馬遜云科技宣布,在Amazon Bedrock上正式推出Palmyra X5——這是一款全新的具備一百萬token上下文窗口的自適應推理模型。該模型由企業級生成式AI領軍企業Writer發布,是首批在Amazon Bedrock提供如此大規模上下文窗口的模型之一。該模型在速度和成本效率方面進行了優化,使客戶能夠構建先進的多步驟AI agents,并能精確處理海量企業數據,從根本上改變了推理方式。亞馬遜云科技現已成為首家且目前唯一提供Writer完全托管、無服務器模型的云提供商,包括最新Palmyra X5及Palmyra X4,其他更多模型也將很快上線。
隨著生成式AI技術的加速發展,客戶需要廣泛的模型選擇以精準匹配業務需求。Writer模型在Amazon Bedrock的推出,進一步豐富了Amazon Bedrock廣泛的完全托管模型的選擇,這些模型均來自領先的AI企業,幫助客戶能更輕松、安全地構建和擴展生成式AI應用,推動業務轉型與創新。
Palmyra X5是首批在Amazon Bedrock提供一百萬token上下文窗口的模型之一,為亞馬遜云科技的客戶提供更多選擇(上下文窗口指一個模型每次輸入/請求能處理和"記憶"的信息量。它以模型處理的最小文本單位token為計量單位,可視為模型的"短期記憶")。憑借這種規模的上下文窗口,Palmyra可精準處理1500頁內容(相當于6本書)。該模型還是業界首批企業級自適應推理模型之一,并兼具先進的大語言模型能力以及擴展的記憶、處理能力。企業現可在預算范圍內處理廣泛任務,包括財務報告、法律合同分析、醫療記錄整合、客戶反饋挖掘等。
除推理能力外,Palmyra X5 還具有多項強大功能,能夠支持與系統交互的agents、支持高級代碼生成與部署,并支持超過30種語言。
Palmyra X5 介紹:
若將Palmyra X5模型擬人化,它就像具有超能力——可在22秒內讀完一百萬個單詞的內容,并即時生成可執行的見解。它不僅能完整記憶200頁戰略文檔的全部內容,更能理解其與昨天的客戶會議、上個季度財務數據的內在關聯。面對復雜的問題時,它能系統化地逐步推進解決方案,全程清晰闡述思考路徑——無論是幫助分析海量客戶反饋以提煉共性,還是排查技術故障。
Writer 首席技術官兼聯合創始人 Waseem AlShikh 表示:"我們選擇亞馬遜云科技作為首家提供Writer完全托管模型的主流云服務提供商,源于其無與倫比的安全性,以及雙方在變革企業AI應用方式、驅動創新增長愿景上的高度契合。Palmyra X5是Writer迄今最先進的模型,它能高速處理海量企業數據,這對于擴展多代理系統(multi-agent systems)至關重要。通過Amazon Bedrock,我們將這些強大功能帶給全球更多企業,幫助客戶在安全、可擴展的環境中部署。"
亞馬遜云科技 Amazon Bedrock 總監 Atul Deo 表示:"基于與Writer的深度戰略合作,我們很高興通過Amazon Bedrock提供Writer的Palmyra系列模型,賦能企業開啟智能Agent創新的新時代。Palmyra X5在長上下文窗口中提供卓越性能,兼具企業級可靠性與速度。無縫接入Writer的Palmyra X5將讓開發者和企業利用亞馬遜云科技的安全性、擴展性和性能,構建和擴展AI agents,實現海量企業數據推理范式的革新。"
數據解析:
盡管生成式AI正在改變我們創建、分析和交互信息的方式,但Agentic AI將從根本上重塑工作本質。AI的這一新前沿超越了內容生成與洞察提煉,轉向能夠自主規劃、執行和調整復雜動作序列的AI agents。通過Amazon Bedrock提供的Palmyra X5,亞馬遜云科技的客戶可使用Writer的模型安全私密地構建和擴展AI agents,無需管理底層基礎設施。此外,對各行業的企業來說,Palmyra X5最令人振奮的是能夠構建和部署更復雜的AI agents,這些agents可以處理海量數據,并與其他agents、大語言模型及外部系統工具進行交互。
Writer提供精確且完全自主的模型,杜絕后期訓練量化與知識蒸餾,確保今天驗證的行為模式與明天的行為模式保持一致。Palmyra X5在此基礎上強化技術承諾,嚴格保持后向兼容性以避免團隊重復調優流程的痛苦,同時發布客戶可參與制定的公開企業技術路線圖,并通過優化推理延遲,使即便在百萬token量級下,大語言模型交互和檢索增強生成(RAG)也能實現近乎即時的響應。
Writer宣布,得益于創新型Transformer設計(一種支持輸入數據并行處理而非順序處理的架構)與混合注意力機制(允許多種方式同時關注信息,既保證效率也確保效果),其未來發布的所有大語言模型將以一百萬token作為最小上下文窗口規模。這意味著企業可基于持續擴展的AI能力制定長期戰略,而不受限于上下文窗口的規模約束。
訪問亞馬遜云科技新聞博客獲取Palmyra X5的詳細信息,包括模型在Amazon Bedrock的部署方法與潛在用例,并查看Amazon Bedrock中的Writer產品頁面。立即訪問Amazon Bedrock控制臺開始使用Palmyra X5和 Palmyra X4。