IDEA上直接运行分布式运算测试报错及 IDEA使用教程

前言：当你写Spark代码是，想要在IDEA上运行测试代码，你会发现有关以下报错：（注意：这里读取的是本地文件）
IDEA上直接运行分布式运算测试报错及 IDEA使用教程
注意：报这个错误的意思是，当前这个IDEA不适合运行跟hadoop相关的分布式程序，解决方法：

但是，如果你读取的是hdfs上的文件则会报一下错误：
IDEA上直接运行分布式运算测试报错及 IDEA使用教程
注意：报这个错误的意思表示，IDEA无法连接到集群的hadoop，解决方法。

下载集群上hadoop安装目录 /etc/hadoop/下的文件core-site.xml和hdfs-site.xml文件。
将下载的文件复制到IDEA中以下路径下：
也可以添加log4j.properties文件，此文件的的作用是屏蔽控制台输出日子
注意：添加以上文件到resources目录下后代码中传入的路径默认为hdfs文件，做以下处理则可以改为读取本机本地路径文件：

val pp = sparkSession.read.json("file:\\C:\\Down\\spark\\people.json")
（在路径前加：file:\\，后面添加本地路径即可）