azkaban3.57环境搭建与简单使用

环境centos6.4  jdk1.8   git 2.8.3

先下载安装并解压azkaban3.57

进入解压后的目录,进行./gradlew build -x test编译

 

编译成功后

[[email protected] azkaban-3.57.0]# cd azkaban-solo-server/

[[email protected] azkaban-solo-server]# cd build/distributions/

[[email protected] distributions]# tar -zxvf azkaban-solo-server-0.1.0-SNAPSHOT.tar.gz -C /opt/software/

 

 

[[email protected] conf]# pwd
/opt/software/azkaban-solo-server-0.1.0-SNAPSHOT/conf
 

[[email protected] conf]# vim azkaban.properties

# Azkaban Personalization Settings
azkaban.name=Jeff
azkaban.label=Jeff Azkaban
。。。

 

[[email protected] conf]# vim azkaban-users.xml

<azkaban-users>
  <user groups="azkaban" password="azkaban" roles="admin" username="azkaban"/>
  <user password="metrics" roles="metrics" username="metrics"/>
  <user password="000000" roles="admin"  username="jeff" />
  <role name="admin" permissions="ADMIN"/>
  <role name="metrics" permissions="METRICS"/>
</azkaban-users>
 

 

配置好后启动Hadoop集群

 

然后[[email protected] bin]# ./start-solo.sh

 

访问端口是8081

azkaban3.57环境搭建与简单使用

日志的存放位置在/opt/software/azkaban-solo-server-0.1.0-SNAPSHOT/local

 

创建一个项目出来

azkaban3.57环境搭建与简单使用

因为当前的azkaban项目仅仅只支持上传zip包 

 

创建两个文件,一个是project,一个是flow

azkaban3.57环境搭建与简单使用

azkaban3.57环境搭建与简单使用

azkaban3.57环境搭建与简单使用

azkaban3.57环境搭建与简单使用

azkaban3.57环境搭建与简单使用

 

完成简单的操作之后,我们开始跑一个稍微复杂一点的,mr作业

在flow上编辑

nodes:
  - name: mr-etl
    type: command
    config:
      command: /opt/software/hadoop-2.6.0-cdh5.7.0/bin/hadoop jar /opt/software/hadoop-2.6.0-cdh5.7.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0-cdh5.7.0.jar wordcount /jeff/test  /jeff/out3

 

azkaban3.57环境搭建与简单使用

(command的路径一定要写全)

 

schedule能控制每分钟调度作业

azkaban3.57环境搭建与简单使用