曝光| 百度的集群管理系统Matrix

百度基础架构部主任架构师吕毅,作为百度资深的集群管理系统专家受2015GITC全球互联网技术峰会邀请为峰会参与者做分享,并曝光了百度自研的集群管理系统Matrix。

曝光| 百度的集群管理系统Matrix


曝光| 百度的集群管理系统Matrix

吕毅

百度基础架构部主任架构师

百度集群操作系统Matrix

Matrix是百度自主研发的集群管理系统的代称,承担着百度数据中心的集群管理,资源管理和调度的职能。Matrix为百度所有的产品线提供规范的底层架构,提供完整的容器(container based)服务解决方案 。

Matrix能实现什么?

Matrix致力于解决实例调度,实例混布,资源隔离,资源分配,服务发布部署,自动故障恢复等一系列问题,实现一个能够托管服务并解决服务运行中异常问题的自动化平台。

曝光| 百度的集群管理系统Matrix

曝光| 百度的集群管理系统Matrix

曝光| 百度的集群管理系统Matrix

通过混布服务、计算以及灵活调配资源,使数据中心资源利用最大化;结合服务自身的容错性设计,可以使服务的可用性大幅提升;通过提供API和工具,使得服务的自动扩展变得更容易;通过规范开发、运行框架,最大程度上减少开发、测试和运维的成本。

曝光| 百度的集群管理系统Matrix

曝光| 百度的集群管理系统Matrix

曝光| 百度的集群管理系统Matrix

Matrix做到了什么?

Matrix已全面覆盖百度的搜索、广告、移动、糯米等核心业务系统,能够提供完整的容器(container based)服务解决方案;目前Matrix已经托管了百度所有离线计算(包括代理计算)和分布式存储,服务器规模达几十万台,并解决服务运行中异常问题的自动故障恢复;同时配合资源管理方式的变革,支持资源交付,资源预结算,实现完全的资源化支持。

曝光| 百度的集群管理系统Matrix

曝光| 百度的集群管理系统Matrix

依托于matrix资源管理构建的百度开放云业务,能够很好的结合百度自身的技术优势,为客户提供稳定,可靠,功能全面的云托管及周边服务。

百度开放云

点击“阅读原文,了解百度开放云