机器学习 Tensorflow 环境搭建
Tensorflow的主要依赖包
Protocol Buffer
Protocol Buffer是Tensorflow系统中使用到的重要工具,Tensorflow中的数据基本都是通过Protocol Buffer来组织的。
结构化数据进行持久化和网络传输时,需要先将其序列化(将结构化的数据变成数据流的格式,简单地说就是变为一个字符串)。除了Protocol Buffer,Xml和Json也是两种比较常用的结构化数据处理工具。
Protocol Buffer格式的数据和Xml和Json格式的数据有比较大的区别:Protocol Buffer序列化之后得到的数据不是可读的字符串,而是二进制流;Protocol Buffer序列化和反序列化都需要定义数据格式;Protocol Buffer序列化出来的数据比Xml的数据小3到10倍,解析时间要快20到100倍。
- required:必须的
- optional:可选的,可以为空
- repeated:可重复的,可以是列表
Bazel
一种编译方式,Bazel对Python支持的编译方式只有三种:py_binary、py_library、py_test。
Tensorflow安装
Docker安装
Docker是新一代的虚拟化技术,需要先安装Docker。然后需要有一个打包好的Docker镜像,对于Tensorflow发布的每一个版本,谷歌都提供了4个官方镜像,冒号后面的部分表示Tensorflow的版本。
pip安装
pip是一个安装、管理Python软件包的工具。
- a. 安装pip
- b. 通过pip安装Tensorflow:sudo pip3 install --upgrade ‘Tensorflow_URL’
源码安装
先将Tensorflow源码编译成pip安装包(可能需要一些工具包),然后用pip安装