Thrift实现原理

RPC框架是什么

RPC，即 Remote Procedure Call（远程过程调用），通俗点说就是：调用远程计算机上的服务，就像调用本地服务一样。

两个服务A和B，部署在不同的服务器上，由于在不同服务器，所以，A服务想要调用B服务，是没法直接进行调用的，那么就需要用网络来表达调用的语义和传达调用的数据。

如何做呢？主要需要解决如下几个问题：

解决通讯的问题，一般来说都是建立服务器与客户端的TCP连接或HTTP连接，所有服务器与客户端的数据交互都是在这个连接里进行，TCP 是传输层协议，HTTP 是应用层协议，而传输层较应用层更加底层，在数据传输方面，越底层越快，因此，在一般情况下，TCP 一定比 HTTP 快，像早期的Web Service 就是基于 HTTP 协议的 RPC，它具有良好的跨平台性，但其性能却不如基于 TCP 协议的 RPC。
解决服务发现的问题，A服务如何告诉B服务它提供了什么样的能力，一般都会有注册中心等做服务发现，目前流行的都是使用zookeeper做注册中心进行服务发现。
解决传输问题，服务调用需要将底层数据通过TCP或HTTP进行传输，那么如何高效的序列化以及反序列化就是需要解决的问题，市面上有很多优秀的序列化框架，比如：Protobuf、Kryo、Hessian、Jackson 等，它们可以取代 Java 默认的序列化，从而提供更高效的性能

目前流行RPC框架有很多，从最早的CORBA，Java RMI到Web Service的RPC，Hessian，Dubbo，Thrift，这些RPC框架都是为了能够提供出一套快捷，方便的服务调用。我们这里针对Thrift的一套实现来看一下它是如何做到解决上述问题的。

Thrift架构

Thrift实现原理

如图：

黄色部分是用户实现的业务逻辑。
褐色部分是根据 Thrift 定义的服务接口描述文件生成的客户端和服务器端代码框架。

Processor类，该类主要是开发Thrift服务器程序的时候使用，该类内部定义了一个map，它保存了所有函数名到函数对象的映射，一旦Thrift接到一个函数调用请求，就从该map中根据函数名字找到该函数的函数对象，然后执行它。
红色部分是根据 Thrift 文件生成代码实现数据的读写操作。
TProtocol传输协议，传输协议是用来描述what is transmitted。

Thrift 可以让用户选择客户端与服务端之间传输通信协议的类别，在传输协议上总体划分为文本 (text) 和二进制 (binary) 传输协议，为节约带宽，提高传输效率，一般情况下使用二进制类型的传输协议为多数，有时还会使用基于文本类型的协议。不同协议的实现体现在传输数据上是这样的，例如实现了TProtocol接口的TBinaryProtocol类，对于readDouble()函数就是按照二进制的方式读取出一个Double类型的数据。同理，写入的时候，也会按照对应的协议进行写入操作。

目前Thrift支持的协议有这些种：
- TBinaryProtocol —— 二进制编码格式进行数据传输
- TCompactProtocol —— 高效率的、密集的二进制编码格式进行数据传输
- TJSONProtocol —— 使用 JSON 的数据编码协议进行数据传输
- TSimpleJSONProtocol —— 只提供 JSON 只写的协议，适用于通过脚本语言解析

Thrift实现原理

TTransport传输层，传输层是用来描述how to transmitted

传输层实际上可以理解为对I/O层操作的一个封装，更直观的理解为它封装了一个socket，不同的实现类有不同的封装方式，常见的一般为阻塞式，同步非阻塞式和异步非阻塞，目前支持的有如下几种：
- TFramedTransport 使用非阻塞方式，按块的大小进行传输
- TSocket 使用阻塞式IO进行传输
- TNonblockingTransport 使用非阻塞方式，用于构建异步客户端