Tensorflow代码目录组织
今天了解一下tensorflow的项目组织结构,其github链接如下:https://github.com/tensorflow/tensorflow
Tensorflow/core目录包含了TF核心模块代码。
- public: API接口头文件目录,用于外部接口调用的API定义,主要是session.h 和tensor_c_api.h。
- client: API接口实现文件目录。
- platform: 主要是隔离不同的操作系统,包含了不同OS系统相关接口文件,如file system, env等,降低了跨平台的难度。
- protobuf: tensorflow前后端主要是使用了protocol buffer协议定义。在源码目录中、最主要的是master_service.proto和work_service.proto两个文件。分别声明了master和worker的服务借口。
- common_runtime: 公共运行库,包含session, executor, threadpool, rendezvous, memory管理, 设备分配算法SimplePlacer,对device的定义,内存分配算法BFC(best-fit with coalescing)。
- distributed_runtime: 分布式执行模块,如rpc session, rpc master, rpc worker, graph manager。
- framework: 实现了tf的基本运行方式。其中包含tensor等数据结构,还包括数据类型,资源管理器以及通信机制等信息。算子的实现中采用了注册机制。
- graph: 实现的计算图模型的数据结构,包括边edge,节点node,图graph等。以及图的遍历算法以及布置节点所需要的代价模型。
- kernels: kernels是op的底层实现,op是kernels的上层抽象。对于不同的计算平台(gpu\cpu\tpu等)有不同的实现。比如对于cpu来说,数值计算会基于Eigen库。Eigen库是一个c++编写的模板库,支持整数、复数、浮点数,使用模板编程、可以为特殊数据结构提供矩阵操作。而gpu的运算则是基于cuda完成的。
- lib: 公共基础库,如gif、gtl(google模板库)、hash、histogram等。
- ops: 基本ops运算,ops梯度运算,io相关的ops,控制流和数据流操作
- Tensorflow/stream_executor目录是并行计算框架,由google stream executor团队开发。
- Tensorflow/contrib目录是contributor开发目录。
- Tensroflow/python目录是python API客户端脚本。
- Tensorflow/tensorboard目录是可视化分析工具,不仅可以模型可视化,还可以监控模型参数变化。
- third_party目录是TF第三方依赖库。
- eigen3: eigen矩阵运算库,TF基础ops调用
- gpus: 封装了cuda/cudnn编程库