草庐IT

【云栖2023】王峰:开源大数据平台3.0技术解读

本文根据2023云栖大会演讲实录整理而成,演讲信息如下:演讲人:王峰|阿里云研究员,阿里云计算平台事业部开源大数据平台负责人演讲主题:开源大数据平台3.0技术解读实时化与Serverless是开源大数据3.0时代的必然选择阿里云开源大数据平台孵化于阿里巴巴集团内部业务。早在2009年,我们就开始采用开源Hadoop技术体系来服务阿里内部快速发展的电商业务。在阿里巴巴内部这套Hadoop技术体系,当时叫云梯一,当发展成熟后,开始上云。我们在阿里云上推出了第一款开源大数据产品E-MapReduce,简称EMR。我们把这个定义为开源大数据平台的第一阶段,也就是1.0的时代,从此刻开始,真正跨入云原生