百万数据解析-python-oss-python(2-历史数据)

上传oss工具安装

阿里文档:

百万数据解析-python-oss-python(2-历史数据)

实际运行,如下图:

百万数据解析-python-oss-python(2-历史数据)

服务器历史文件:3000多个  100多G

百万数据解析-python-oss-python(2-历史数据)

经过解析后的txt文件:

百万数据解析-python-oss-python(2-历史数据)

百万数据解析-python-oss-python(2-历史数据)

调用命令上传文件:

百万数据解析-python-oss-python(2-历史数据)

oss结果:

百万数据解析-python-oss-python(2-历史数据)

新建odps外表及设立分区:

百万数据解析-python-oss-python(2-历史数据)

使用数据:

百万数据解析-python-oss-python(2-历史数据)

百万数据解析-python-oss-python(2-历史数据)

小插曲:

建表时最好用String,因为可能存在脏数据,odps在转换成 bigint 或者 decimal的时候可能会报错。

最后最后,shell脚本开启并行

百万数据解析-python-oss-python(2-历史数据)

python程序飞起来:

百万数据解析-python-oss-python(2-历史数据)