用戶無需配置、管理和擴展集群或服務器即可運行大數據分析應用程序
北京2023年5月11日 /美通社/ -- 亞馬遜云科技今天宣布,其大數據分析服務Amazon EMR Serverless在由光環新網運營的亞馬遜云科技中國(北京)區域和由西云數據運營的亞馬遜云科技中國(寧夏)區域正式上線。Amazon EMR是行業領先的大數據分析服務,適用于使用開源框架進行PB級數據處理、交互分析和機器學習,同時其性能遠優于開源版本。Amazon EMR性能比開源Apache Spark 3.3快3.9倍, 成本僅為其40%;比開源Presto 0.338 快3.1倍,成本僅為其80%。Amazon EMR Serverless是Amazon EMR的無服務器部署選項,客戶無需配置、管理和擴展集群或服務器即可運行大數據分析應用程序。
Amazon EMR Serverless是一種快速、可擴展、彈性的分析服務,為企業提供了有效的大規模數據處理方式,并且不需要企業預先配置或管理服務器。這一服務具備敏捷、可以快速啟動、高度可擴展、具備成本效益、高度安全和支持多可用區域部署六大獨特優勢。
行業前沿實踐
流媒體巨頭Disney+率先采用Amazon EMR Serverless。Disney+的數據平臺涵蓋了100個賬號,20PB的數據,并且來自Disney+、ESPN+和Hulu的15個以上團隊都在這些數據上進行分析。由于業務場景非常復雜,需要支持多團隊和跨部門的數據協作以及海量數據場景,因此強大的數據基礎設施必不可少。Disney+采用了Amazon EMR Serverless作為大數據平臺。Amazon EMR Serverless在多租戶、多應用、多任務場景下具有高性能和彈性伸縮特性,幫助Disney+解決了遇到的性能和管理問題。與在Amazon Elastic Compute Cloud上使用Amazon EMR相比,Disney+使用Amazon EMR Serverless,將所需時間降低了30%,將成本降低了75%。
全面的Serverless數據分析服務選項
除Amazon EMR Serverless之外,亞馬遜云科技還提供了包括Amazon Redshift數據倉庫、Amazon Glue數據集成、Amazon OpenSearch日志分析、Amazon QuickSight商業智能工具、Amazon Managed Streaming for Apache Kafka (Amazon MSK)實時數據分析等眾多服務,且所有服務都提供Serverless選項。這些服務可以幫助企業收集、存儲、處理和分析海量數據,以便更好地理解客戶行為、優化業務決策并探索新機會。此外,亞馬遜云科技還提供了一系列與數據相關的托管服務,例如Amazon Relational Database Service(Amazon RDS)關系型數據庫、Amazon DynamoDB云原生數據庫,以及Amazon Simple Storage Service(Amazon S3)對象存儲服務,可以輕松快速地創建基于云的數據庫、數據湖和數據倉庫,為企業提供高性能、可擴展和安全的數據管理解決方案。