阿 裏雲 EMR Serverless Spark 版是一款雲原生,專為大規模數據處理和分析而設計的全托管 Serverless 產品。 它為企業提供了一站式的數據平台服務,包括任務開發、偵錯、排程和運維等,極大地簡化了數據處理的全生命周期工作流程。 使用 EMR Serverless Spark 版,企業可以更專註於數據分析和價值提煉,提高工作效率。
阿裏雲 EMR Serverless Spark 版 現已開啟公測,歡迎廣大開發者及企業使用者參與,解鎖全托管、一站式數據開發體驗。
產品優勢
雲原生極速計算引擎 :內建 Spark Native Engine,相對開源版本 效能提升200% ;內建 Celeborn,支持 PB 級 Shuffle 數據,計算資源總成本 最高下降 30% 。
開放化的數據湖架構 :支持計算儲存分離,計算可彈性伸縮、儲存可按量付費;對接 OSS-HDFS,完全相容 HDFS 的雲上儲存,無縫平滑遷移上雲;中心化的 DLF 後設資料,全面打通湖倉後設資料。
一站式的開發體驗 :提供作業開發、偵錯、釋出、排程等一站式數據開發體驗;內建版本管理、開發與生產隔離,滿足企業級開發與釋出標準。
Serverless 的資源平台 :開箱即用,無需手動管理和運維雲基礎設施;彈性伸縮,秒級資源彈性與供給。
套用場景
基於 EMR Serverless Spark 版建立數據平台
得益於EMR Serverless Spark 版開放的產品架構,使得其在數據湖中對結構化和非結構化數據進行分析與處理變得簡單高效。此外,還內建了任務排程系統,允許使用者輕松構建和管理數據 ETL 任務,實作數據管道的自動化和周期性數據處理。
EMR Serverless Spark 版還內嵌了先進的版本管理系統,並提供了開發與生產環境的完全隔離,確保符合企業級使用者在研發和釋出流程方面的嚴格要求。這些特性共同保障了數據處理的可靠性和效率,同時滿足企業級套用的高標準要求。
公測說明
EMR Serverless Spark 版免費公測已開啟,預計於2024年06月25日結束。公測階段面向所有使用者開放,您可以免費試用。免費試用結束後,產品將正常計費。
免費公測限制
公測期間,有以下限制:
工作空間的資源配額上限為100計算單元(CU)。
單個Spark任務所能處理的Shuffle數據量最大限制為5TB。
工作空間內所有並列執行的任務共寫入Shuffle數據的總量上限為10TB。
同一工作空間內允許並行執行的任務數量上限為100個。
不保障服務等級協定(SLA),但服務不降級。
公測期間包年包月的工作空間僅支持續費一個月。
操作步驟
進入 EMR Serverless Spark 頁面。
登入 E-MapReduce控制台(https://emr-next.console.aliyun.com/#/region/cn-hangzhou/resource/all/overview) 。
在左側導航欄,選擇 EMR Serverless > Spark 。
在頂部選單欄處,根據實際情況選擇地域。
在 Spark 頁面,單擊 建立工作空間 。
在 E-MapReduce Serverless Spark 頁面,完成相關配置。
參數 | 說明 | 範例 |
地域 | 建議選擇與您數據所在地相同的地域。 | 華東1(杭州) |
付費型別 | 目前僅支持 按量付費 。 | 按量付費 |
工作空間名稱 | 以字母開頭,僅支持英文字母、數位和短劃線(-),長度限制為1~60個字元。 說明 同一個阿裏雲帳號下的工作空間名稱是唯一的,請勿填寫已有的名稱,否則會提示您重新填寫。 | emr-serverless-spark |
DLF Catalog | 用於儲存和管理您的後設資料。 開通DLF後,系統會為您選擇預設的DLF數據目錄,預設為UID。如果針對不同集群您期望使用不同的數據目錄,則可以按照以下方式新建目錄。
| emr-dlf |
瞬時資源上限 | 工作空間同時處理任務的最大並行CU數量。 | 100 |
工作空間基礎路徑 | 用於儲存作業日誌、執行事件、資源等數據檔。建議選擇一個開通了OSS-HDFS服務的Bucket。 | emr-oss-hdfs |
工作空間型別 | 支持 基礎版 和 專業版 。更多資訊,請參見 工作空間型別說明(https://help.aliyun.com/zh/emr/emr-serverless-spark/getting-started/create-a-workspace?spm=a2c4g.11186623.0.i5#2458cb0494a4h) 。 | 專業版 |
高級設定 | 開啟該開關後,您需要配置以下資訊: 執行角色 :指定EMR Serverless Spark執行作業所采用的角色名,角色名稱為AliyunEMRSparkJobRunDefaultRole。 EMR Spark使用該角色來存取您在其他雲產品中的資源,包括OSS和DLF等產品的資源。 | AliyunEMRSparkJobRunDefaultRole |
4.當所有的資訊確認正確後,單擊 建立工作空間 。
聯系我們
如果您在使用 EMR Serverless Spark 版的過程中遇到任何疑問,可加入釘釘群 58570004119 咨詢。
快速跳轉
EMR Serverless Spark 版 官網: https://www.aliyun.com/product/bigdata/serverlessspark
產品控制台: https://emr-next.console.aliyun.com/
產品文件: https://help.aliyun.com/zh/emr/emr-serverless-spark/
SQL 任務快速入門: https://help.aliyun.com/zh/emr/emr-serverless-spark/getting-started/get-started-with-sql-task-development
點 擊「 閱讀原文 」立即參與 EMR Serverless Spark 版免費公測!