Athena:用LazySimpleSerde跳过标题行
问题描述:
想知道是否可以跳过Aws Athena的org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe
中的标题行。我尝试过tblproperties ('skip.header.line.count' = '1')
,但不起作用。我的头文件与OpenCSVSerDe协同工作,但它似乎只支持string
数据类型,这将在查询中结束很多工作。Athena:用LazySimpleSerde跳过标题行
答
我刚才试过如下:
创建一个CSV文件并上传到S3:
breed_id, breen_name, category
1,pug,toy
2,German Shepard,working,
3,Scottish Terrier,Working
运行雅典娜以下DDL:
create external table dogs (
breed_id int,
breen_name string,
category string
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n'
LOCATION 's3://XXXXXXXXXXXXXX/'
TBLPROPERTIES ('skip.header.line.count'='1')
;
然后运行下面的查询:
SELECT * FROM "default"."dogs" LIMIT 10;
产生以下结果: