前几天邮箱收到kaggle比赛即将截止的通知,但是事多没去看。今天想到去看了下,发现已经截止了。
比分咬得很紧,第一名0.80977,而我0.80667已经是1000+了。
最后一次提交还是一月前的事,如果能提前登录ensemble下公开notebook应该会有更好的结果~但还是记录一下吧,也学到了很多。
比赛介绍
链接-https://www.kaggle.com/competitions/amex-default-prediction/overview,简单说就是通过customer往期的大数据,预测不还信用卡的概率。
数据集很大,test_data.csv有32G,
train_data.csv有16G。
数据集的每列有csutomer_ID, date, 各种features, 我们要根据这些得出每个customer_ID未来还款的概率。
特征工程 transformer
date信息
未完待续