Datawhale零基础入门金融风控 task-1 初识数据

这次已经是我第n次参加datawhale活动了,每次任务都比较贴合实际生产生活,选题都比较有代表性。硕士毕业后第一次(纪念下)

赛题以预测金融风险为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过
120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20
万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。

train文件情况

Datawhale零基础入门金融风控 task-1 初识数据

Datawhale零基础入门金融风控 task-1 初识数据

竞赛采用AUC作为评价指标。AUC(Area Under Curve)被定义为 ROC曲线 下与坐标轴围成的面积。

8种评分指标

Datawhale零基础入门金融风控 task-1 初识数据

Datawhale零基础入门金融风控 task-1 初识数据

Datawhale零基础入门金融风控 task-1 初识数据

Datawhale零基础入门金融风控 task-1 初识数据

交作业啦~希望这次可以按时按需交作业 哈哈哈哈哈