hive加载csv文件时出现乱码情况
原因分析:
excel保存的csv文件为GB编码,而linux默认为utf-8编码,所以在linux内部会显示乱码现象。
修改:另存为csv文件,选择工具菜单,更改编码为Unicode,不要选更改为Unicode(Utf-8)因为仍然显示乱码。
得到另存为的csv文件后,使用notepad++文本编辑器打开文档,在右下角可以看到文档的编码方式。
打开表头的编码文件夹,选择对应的编码方式,转换为utf-8编码。
看到右下角的编码方式更改为utf-8时,即完成编码转换,此时即可以在linux中正常显示,并加载到hive表中。