SparkContext -- v 2.2

Spark的对外接口，代表了与spark 集群交互的连接,负责向调用这提供Spark的各种功能
主要功能：
- 在集群上，创建RDD,累加器，广播变量等
driver 和 executor都会创建 sparkContext

初始化过程 -- driver

前置条件SparkConf设置：
- spark.master 必须设置
  - 本地模式为 local[*]
  - 集群模式为 master地址，如：spark://192.168.0.147:7077
初始化或者从缓存获取SparkContext ：
- SparkContext##getOrCreate(config: SparkConf)
程序入口点
- new SparkContext(config) <== v 2.0.0以前
- SparkSession.builder.appName("Simple Application").getOrCreate() <== v 2.0.0 开始推荐
  - 提供了一个统一的切入点来使用Spark的各项功能
  - SparkConf、SparkContext和SQLContext都已经被封装在SparkSession当中,简化操作
    - 创建Dataset和Dataframe
    - 读取各种数据（json,jdbc)
    - 使用SparkSQL
    - 存储/读取Hive表
重要组件初始化并启动
- SparkUI
  - 客户端webui,默认端口4040
- schedulerBackend [后台线程]:管理系统，与master,worker通信，决定如何获取资源，配合TaskSchedulerImpl运行task
  - 具体实现类：
    - local模式：
      - LocalSchedulerBackend
    - spark standalone模式：
      - StandaloneSchedulerBackend
    - 其他模式，通过外部加载方式动态调用:
      - 加载META-INF.services文件中的配置的ExternalClusterManager实现类
      - 实例化类，并调用canCreate方法匹配url，匹配成功的通过该Manager创建对应的schedualBackend，与taskScheduler
      - yarn模式(源码位置：resource-managers/yarn)：
        
        在resources的META-INF.services文件中配置为：org.apache.spark.scheduler.cluster.YarnClusterManager
        
        YarnClusterManager#canCreate实现为判断masterURL == "yarn"
        
        TaskScheduler创建：YarnClusterManager#createTaskScheduler
        
        cluster模式：YarnClusterScheduler
        
        client模式：YarnScheduler
        
        SchedulerBackend创建：YarnClusterManager#createSchedulerBackend
        
        cluster模式：YarnClusterSchedulerBackend
        
        client模式：YarnClientSchedulerBackend
  - 意图：不同集群资源获取方式不一样，相对于不同的集群提供不同的策略实现
  - 接口方法
    - reviveOffers,找到合适work的合适的executor资源给task运行
  - 在standalone模式下，StandaloneSchedulerBackend负责集群资源的获取和调度。继承自CoarseGrainedSchedulerBackend。
    - 客户端通信线程:StandaloneAppClient
      - client = new StandaloneAppClient(sc.env.rpcEnv, masters, appDesc, this, conf)
      - 将driver app信息注册到spark 的master，包含driver端的通信地址
      - 监听并处理来自master过来的消息
    - StandaloneSchedulerBackend#StandaloneAppClient#tryRegisterAllMasters，将driverapp注册到 master
      - val masterRef = rpcEnv.setupEndpointRef(masterAddress, Master.ENDPOINT_NAME),远程调用master地址的RpcEndpointVerifier，检查master地址是否可以连接
        
        最终通过TransportClient，与master server通信发送消息
        
        message.sendWith(_client)
      - masterRef.send(RegisterApplication(appDescription, self))，向master发送app注册消息
  - 在本地模式下，LocalSchedulerBackend
- TaskScheduler :
  - 接收 DAGScheduler 划分好stage之后包含task列表的set
  - 负责发送task给集群运行，已经失败重试等操作
  - 接口方法
    - submitTasks：提交任务执行
- persistentRdds :一个线程安全的map,跟踪所有缓存rdd, gc是自动释放缓存
  - val map: ConcurrentMap[Int, RDD[_]] = new MapMaker().weakValues().makeMap[Int, RDD[_]]() map.asScala
  - MapMaker:
    - Google Collections中的MapMaker融合了Weak Reference，线程安全，高并发性能，异步超时清理，自定义构建元素等强大功能于一身。
- DAGScheduler ： DAG计算
  - 为每一个job计算DAG图，把划分的stage作为taskset的形式提交给TaskScheduler执行task
- SparkEnv ：给spark实例(master,worker）保存运行时环境变量，是全局变量，所有线程都可以访问相同的sparkEnv
  - SecurityManager ：负责全局安全权限控制
  - RpcEnv：NettyRpcEnv ，rpc调用环境信息
    - netty server启动 ==> TransportServer
      - 负责接受master等rpc调用
    - 消息派发 ==> Dispatcher
      - 负责将netty server接受到的rpc 消息路由到对应的endpoint处理
    - 使用netty client发送rpc消息
    - outboxes:消息发送缓冲区
  - SerializerManager：为spark各种组件提供序列化，压缩，加密等配置信息
    - conf.set("spark.serializer", "org.apache.spark.serializer.KryoSerializer") 使用kryo序列化方式代替默认java序列化提高性能,适用RDD api
    - DataFrame 使用指定的编码器进行序列化
  - BroadcastManager：消息广播管理
  - MapOutputTrackerMaster(for driver)/MapOutputTrackerWorker(for execute)：一个map,用来跟踪 stage中输出内容的位置，key为shuffleid,value为一组blockManagerId
  - ShuffleManager: Shuffle管理
    - 在driver 和每个 executor 的SparkEnv 中创建
    - 主要方法：
      - registerShuffle，注册一个shuffle操作
      - getWriter：给某个partition获取一个writer,在executors 上 map 任务是调用
        
        ShuffleWriter：实现具体shuffle操作，排序，写文件
      - getReader：在executors上 reduce操作时调用，获取一个reader
        
        ShuffleReader: 将map时候shuffle的文件组合成排序后的partition数据
    - SortShuffleManager：具体实现类
  - MemoryManager：内存管理
    - 控制内存在execution 和 storage之间共享
    - execution memory：
      - 运行时需要的内存如：shuffles, joins,sorts and aggregations
    - storage memory：
      - 缓存数据，如调用rdd.cache
  - blockTransferService: 从远程获取blocks，的传输方式默认：NettyBlockTransferService，通过netty传输
  - BlockManagerMaster：master的block管理，与driver通信
    - val blockManagerMaster = new BlockManagerMaster(registerOrLookupEndpoint( BlockManagerMaster.DRIVER_ENDPOINT_NAME, new BlockManagerMasterEndpoint(rpcEnv, isLocal, conf, listenerBus)), conf, isDriver)
      - 在master上注册driver,返回和master的通信RpcEndpointRef
  - blockManager
    - 管理每个节点（driver和executors)上的消息块
    - 提供了一套管理接口：存放或者接收来自本地和远程的各种消息块
      - getBlockData
      - putBlockData
    - 消息快存储在内存，或者磁盘
      - memoryStore
      - diskStore
启动线程
- NettyRpcEnv#Dispatcher , 线程前缀 dispatcher-event-loop默认线程数=可用cpu数，
  - sparkEnv中rpcEnv初始化创建
  - Runtime.getRuntime.availableProcessors()
  - 派发netty server接收到的rpc消息，找到合适的endpoint处理
- TransportServer,线程前缀 rpc-server,默认工作线程 8个
  - netty server 服务线程，接收并处理rpc调用请求
- MapOutputTrackerMaster,线程前缀 map-output-dispatcher,默认工作线程 8个
  - 获取指定shuffleId中当前节点运行的结果地址，给reduceTask使用
- NettyBlockTransferService
  - 启动了TransportServer，netty server 线程负责处理bolck相关的传输处理
- appclient-registration-retry-thread
  - 重试driver注册到master
- dag-scheduler-event-loop
  - job任务队列处理
- heartbeat-receiver-event-loop-thread
  - 与executors的心跳线程
- rpc netty 通信相关的线程
  - rpc-client
  - rpc-server
Endpoints 远程调用消息处理对象
- RpcEndpointVerifier
  - name : endpoint-verifier
  - 检查某个远程endpoint是否存在
  - 每个通信节点都有，通常获取endpointref之前会调用这个ref先检查一下
- MapOutputTrackerMasterEndpoint
  - name:MapOutputTracker
  - 外部调用获取某个shuffleid对应的映射输出地址
- BlockManager#BlockManagerSlaveEndpoint
  - name:BlockManagerEndpoint1
  - 执行master发过来的命令 * RemoveBlock，RemoveRdd,RemoveShuffle,RemoveBroadcast等
- SparkEnv#OutputCommitCoordinatorEndpoint
  - name:OutputCommitCoordinator
  - handleAskPermissionToCommit,
- BlockManagerMasterEndpoint
  - name:BlockManagerMaster
  - block 管理
- StandaloneSchedulerBackend#StandaloneAppClient#ClientEndpoint +
- HeartbeatReceiver
- CoarseGrainedScheduler

远程通信

类图

spark 源码 ---1-SparkContext-初始化

基本流程

spark 源码 ---1-SparkContext-初始化

通信框架netty

底层通过netty的nio通信
TransportServer : 接受 rpc 请求来自远程应用路由给对应的RpcEndpoint处理
TransportClient ：有RpcEndpointRef发起，发送 rpc 请求给远程应用

RpcEndpoint

rpc通信对象，处理接收到的消息
receive：处理来自 RpcEndpointRef.send 或者 RpcCallContext.reply的消息
receiveAndReply：处理RpcEndpointRef.ask的消息

RpcEndpointRef -- NettyRpcEndpointRef

RpcEndpoint的远程引用，用来发送rpc消息
send：单向发送消息，Fire-and-forget semantics
ask：双向，发送消息之后返回feature,接受返回消息

RpcEnv创建

new NettyRpcEnv
- new Dispatcher
  - 消息总线，路由消息到各个对应的endpoint
  - 主要成员
    - endpoints: ConcurrentMap[String, EndpointData]
    - endpointRefs: ConcurrentMap[RpcEndpoint, RpcEndpointRef]
    - receivers = new LinkedBlockingQueue[EndpointData]
    - dispatcher-event-loop 线程，线程前缀 dispatcher-event-loop默认线程数=可用cpu数，
- TransportClientFactory，启动netty client workerGroup
- NettyRpcEnv#startServer，启动netty server
  - server: TransportServer
    - new TransportServer
      - new ServerBootstrap，启动一个netty服务
      - NettyRpcHandler负责处理连接
      - 启动
- Dispatcher#registerRpcEndpoint
  - new NettyRpcEndpointRef
    - endpointAddress =>spark://[email protected]:52930
      - 和driver通信的地址
  - endpointRefs.put(data.endpoint, data.ref)
    - EndpointData = new EndpointData(name, endpoint, endpointRef)
      - 一组端对端的通信，持有一个通信地址Inbox
      - Inbox，为endpoint存储消息，并交给endpoint处理
  - receivers.offer(data)
- outboxes = new ConcurrentHashMap[RpcAddress, Outbox]()
  - 发送消息的邮箱，实现异步发送消息
  - client: TransportClient
    - netty client
    - sendRpc
  - messages = new java.util.LinkedList[OutboxMessage]

总结

分布式系统中，driver ,master,worker 之间需要相互远程通信
- driver 和各个worker 在master中注册自己，driver 就可以通过master的协调与worker进行远程通信
底层通信模块采用netty 的nio,更好的吞吐量，低延迟，高性能，主要用于：
- NettyRpcEnv中的TransportServer：
  - 进行各个系统之间的远程调用
- NettyBlockTransferService中的TransportServer：
  - block传输，解决数据的高效传输
每个通信节点driver ,master,worker
- 都有一个Netty 的server端用来接受远程节点的请求
- 一组netty 的客户端用来发送请求到其他通信节点
- 一个消息派发器Dispatcher分发消息给对应的endpoint处理
各个系统之间需要很多协调处理，比如driver需要注册到master,获取任务执行的其他节点的处理结果等等，所以需要一些列对象来负责处理这些来自远程对象的请求，这些对象就是endpoints
每个endpoint都对应一个名称，都负责处理一类事件，需要注册到消息派发器Dispatcher
当处理某个需要远程通信的服务如driver需要把自己注册到master,只要知道master的服务地址，和需要哪个endpoint来处理的名称，就可以通过NettyRpcEndpointRef来发送消息给master处理
master节点的netty server接受到来自driver的rpc消息后交给自己的Dispatcher，根据指定的名称找到对应的endpoint来处理
master注册driver的结果以同样的方式通过NettyRpcEndpointRef发送给driver,driver的地址和处理endpoint的名称在driver调用的时候一起带过了
消息处理
- 发送消息信箱Outbox
  - 所有需要发送的消息都放入Outbox的LinkedList[OutboxMessage]的队列中
  - 只有一个线程负责处理这个队列的消息，发送给指定的地址
  - 起到了异步和缓冲的作用
- 消息接受信箱Inbox
  - netty server接受到的请求首先进入了Dispatcher的LinkedBlockingQueue[EndpointData]对应接受远程消息这个过程起到异步缓冲的作用
  - Dispatcher启动多个线程处理这个队列的消息，找到对应的Inbox放入LinkedList[InboxMessage]，对于同一个endpoint的处理异步和缓冲的作用

spark 源码 ---1-SparkContext-初始化

SparkContext -- v 2.2

初始化过程 -- driver

远程通信

类图

基本流程

通信框架netty

RpcEndpoint

RpcEndpointRef -- NettyRpcEndpointRef

RpcEnv创建

总结

相关推荐