MySql架构与历史---1.1 MySQL逻辑架构

和其他数据库相比,MYSQL有点与众不同,他的架构可以在多种不同场景中应用并发挥好的作用,但是同时也会带来一点选择上的困难。Mysql并不完美,却足够灵活,能够适应高要求的环境,例如Web类应用。同时,Mysql即可以嵌入到应用程序中,也可以支持数据仓库,内容索引和部署软件,高可用的冗余系统,在线事务处理系统(OLTP)等各种应用类型。
为了充分发挥Mysql的性能并顺利的使用,就必须理解器设计。MySQL的灵活性体现在很多方面。例如,你可以通过配置使它在不同的硬件上都运行的很好,也可以支持多种不同的数据类型。但是,Mysql最重要的,最与众不同的特性是他的存储引擎架构,这种架构的设计将查询处理(Query Processing)及其他系统任务(Server task)和数据的存储/提取相分离开。这种处理和存储分离的设计可以在使用时根据性能,特性,以及其他需求来选择数据存储的方式。
本章概要的描述了MYSQL的服务器架构,各种存储引擎之间的主要区别,以及这些区别的重要性。另外也会回顾一下Mysql的 历史背景和基准测试,并试图通过简化细节和演示案例来讨论MYSQL的原理。
1.1 MySQL 逻辑架构
如果能在头脑中构建出一幅MySQL各组件之间如何协同工作的架构图,就会有助于深入理解MySQL服务器。下图展示了MySQL的逻辑架构图。
MySql架构与历史---1.1 MySQL逻辑架构
最上层的服务并不是MySql所独有的,大多数基于网络的客户端/服务器的工具或者服务都有类似的架构。比如连接处理,授权认证,安全等等。
第二层架构是MYSQL比较有意思的部分。大多数Mysql的核心服务功能都在这一层,包括查询解析,分析,优化,缓存以及所有的内置函数(例如,日期,时间,数学和加密函数),所有跨存储引擎的功能都在这一层实现:存储过程,触发器,视图等。
第三层包含了存储引擎。存储引擎负责Mysql中数据的存储和提取。和GNU/Linux下的各种文件系统一样,每个存储引擎都有它的优势和劣势。服务器通过API与存储引擎进行通信。这些接口屏蔽了不同存储引擎之间的差异,使得这些差异对上层的查询过程透明。存储引擎API包含几十个底层函数,用于执行诸如“开始一个事务”或者“根据主键提取一行记录”等操作。但存储引擎不会去解析SQL(注:InnoDB是一个例外,它会解析外键定义,因为MySQL服务器本身没有实现该功能),不同引擎之间也不会相互通信,而只是简单的相应上一层服务器的请求。
1.1.1 连接管理与安全性
每个客户端连接都会在服务器进程中拥有一个线程,这个连接的查询只会在这个单独的线程中执行,该线程只能轮流在某个CPU核心或者CPU中运行。服务器会负责缓存线程,因此不需要为每一个新建的连接创建或者销毁线程(注:Mysql5.5或者更新的版本提供了一个API,支持线程池(Thread-Pooling)插件,可以使用池中少量的线程来服务大量的连接)。
当客户端(应用)连接到MySQL服务器时,服务器需要对其进行认证。认证基于用户名,原始主机信息和密码。如果使用了安全套接字(SSL)的方式连接。还可以使用X.509证书认证。一旦客户端连接成功,服务器会继续验证该客户端是否具有执行某个特定查询的权限(例如,是否允许客户端对world数据库的Country表执行Select语句)。

1.1.2 优化与执行
MySQL会解析查询,并创建内部数据结构(解析树),然后对其进行各种优化,包括重写查询,决定表的读取顺序,以及选择合适的索引等。用户可以通过特殊的关键字提示(hint)优化器,影响他的决策过程。也可以请求优化器解释(explain)优化过程的各个因素,使用户可以知道服务器是如何进行优化决策的,并提供一个参考基准,便于用户重构查询和schema,修改相关配置,使应用尽可能高效运行。
优化器并不关心表使用的是什么存储引擎,但是存储引擎对于优化查询是有影响的。优化器会请求存储引擎提供容量或某个具体操作的开销信息,以及表数据的统计信息等。例如,某些存储引擎的某种索引,可以对一些特定的查询有优化。
对于SELECT语句,在解析查询之前,服务器会先检查查询缓存(Query Cache),如果能够其中找到对应的查询,服务器就不必再执行查询解析,优化和执行的整个过程,而是直接返回查询缓存中的结果集。