windows下安装spark

1、安装jdk

windows下安装spark

2、安装scala

windows下安装spark

3、下载spark

spark下载地址
windows下安装spark

3.1安装spark

  • 将下载的文件解压到一个目录,注意目录不能有空格,比如说不能解压到C:\Program Files
  • 作者解压到了这里,
    windows下安装spark
  • 将spark的bin路径添加到path中
    windows下安装spark
  • cmd输入spark-shell,成功安装啦,有个报错是因为还没安装Hadoop,
    windows下安装spark

4、安装hadoop

  • 由于spark版本为spark-2.3.3-bin-hadoop2.7,我们选择下2.8.5版本的Hadoop
    hadoop下载地址
    windows下安装spark

  • 解压
    windows下安装spark

  • 添加环境变量,新建一个HADOOP_HOME
    windows下安装spark

  • 在path添加
    windows下安装spark

  • 到此运行spark-shell还会有没安装的时候那个报错,接下来需要替代Hadoop里的bin文件来解决这个错。

5、下载winutils

  • 下载地址
  • 笔者用的是hadoop2.8.5版本的,下载的winutils上hadoop2.8.3版本的bin,实测也是可行的。
    windows下安装spark
  • 接下来将bin替换原来Hadoop中的bin

6、运行spark-shell成功啦

windows下安装spark