Docker swarm 的一些介绍

部分内容来自网络

Swarm deamon只是一个调度器（Scheduler）和路由器(router),Swarm自己不运行容器，它只是接受docker客户端发送过来的请求，调度适合的节点来运行容器，这意味着，即使Swarm由于某些原因挂掉了，集群中的节点也会照常运行，当Swarm重新恢复运行之后，它会收集重建集群信息。下面是Swarm的结构图：

Docker swarm 的一些介绍

Docker集群管理需要服务发现(Discovery service backend)功能.Swarm支持以下几种discovery service backend：Docker Hub上面内置的服务发现功能，本地的静态文件描述集群(static file describing the cluster),etcd(顺带说一句，etcd这玩意貌似很火很有前途，有时间研究下),consul,zookeeper和一些静态的ip列表(a static list of ips)。

在使用Docker Hub内置的发现服务时，会出现一个问题，就是使用swarm create时会出现

time="2015-04-21T08:56:25Z" level=fatal msg="Get https://discovery-stage.hub.docker.com/v1/clusters/d947b55aa8fb9198b5d13ad81f61ac4d: dial tcp: i/o timeout"

类似于这样的错误，不知道是什么原因，有待解决。

当使用Docker Hub内置的服务发现功能出现问题时，可以使用下面的第二种方法。

第二种方法：使用文件

第二种方法相对而言比第一种方法要简单，也更不容易出现timeout的问题。

第一步：在sclu083这台机器上新建一个文件，把要加入集群的机器的IP地址写进去

Docker swarm 的一些介绍

第二步：在sclu083这台机器上面执行swarm manage命令：

sudo docker run –d –p 2376:2375 –v $(pwd)/cluster:/tmp/cluster swarm manage file:///tmp/cluster

Docker swarm 的一些介绍

注意：这里一定要使用-v命令，因为cluster文件是在本机上面，启动的容器默认是访问不到的，所以要通过-v命令共享。还有，file:///千万不能忘记了

可以看到，swarm已经运行起来了。现在可以查看下集群节点信息了，使用命令：

sudo docker run –rm –v $(pwd)/cluster:/tmp/cluster swarm list file:///tmp/cluster

Docker swarm 的一些介绍

(在使用文件作为服务发现的时候，貌似manage list命令只能在swarm manage节点上使用，在其他节点上好像是用不了)

好了，现在集群也已经运行起来了，可以跟第一种方法一样在其他机器上使用集群了。同样在sclu085 机器上做测试:

Docker swarm 的一些介绍

可以看到，成功访问并且节点信息是正确的。接下来可以把上面的info命令替换成其他docker可执行命令来使用这个晓得Docker集群了。

Swarm调度策略

Swarm在schedule节点运行容器的时候，会根据指定的策略来计算最适合运行容器的节点，目前支持的策略有：spread,binpack,random.

Random顾名思义，就是随机选择一个Node来运行容器，一般用作调试用，spread和binpack策略会根据各个节点的可用的CPU,RAM以及正在运行的容器的数量来计算应该运行容器的节点。

在同等条件下，Spread策略会选择运行容器最少的那台节点来运行新的容器，binpack策略会选择运行容器最集中的那台机器来运行新的节点(The binpack strategy causes Swarm to optimize for the container which is most packed.)。

使用Spread策略会使得容器会均衡的分布在集群中的各个节点上运行，一旦一个节点挂掉了只会损失少部分的容器。

Binpack策略最大化的避免容器碎片化，就是说binpack策略尽可能的把还未使用的节点留给需要更大空间的容器运行，尽可能的把容器运行在一个节点上面。

Docker swarm 的一些介绍

相关推荐