首页 > 竞赛 > 竞赛详情

2018年甜橙金融杯大数据建模大赛 算法竞赛
80000

参赛队伍: 1462

参赛人数: 1648

作品提交数: 4704

竞赛背景

随着互联网+这一概念的不断发展,电商、出行、外卖等行业近些年也持续发展壮大,越来越多的商家进入这一市场。为了在激烈的竞争中拉取新用户,培养用户的消费习惯,各种类型的营销活动和补贴活动也是层出不穷。在为正常用户带来福利的同时,也催生了一批专注于营销活动的“羊毛党”。目前,羊毛党的行为越发专业化,团伙化和地域化,同套利黑产团伙的斗争,是一场永无止境的攻防战。机器学习模型是风控系统中实时识别和对抗黑产攻击的有效手段。面对黑产攻击手段快速多变,黑样本数据标签缺失等问题,目前除了LR,RF等耳熟能详的机器学习模型,基于RNN的深度学习模型,无监督学习模型等技术也被应用到同黑产的对抗中。


主办方简介:

甜橙金融(天翼电子商务有限公司)是中国电信股份有限公司全资子公司,是中国人民银行核准的第三方支付机构,中国证监会核准的基金支付结算机构,现已拥有支付、供应链融资、保险、消费金融、征信、信息技术等互联网金融关键要素。


奖项

第一名 30000元+复试直通卡/实习机会 第二名 20000元+复试直通卡/实习机会 第三名 10000元+复试直通卡/实习机会 第四名 5000元+实习机会 第五名 5000元+实习机会 第六名 2000元+实习机会 第七名 2000元+实习机会 第八名 1000元+实习机会 第九名 1000元+实习机会 第十名 1000元+实习机会 最佳人气奖 3000元



时间安排

10月20日 15:00 报名启动,初赛开始 

12月10日 10:00 初赛结束(前250支队伍晋级复赛)

12月10日 15:00 初赛入围名单公布,复赛开始,数据集更新 

12月14日 10:00 复赛A榜结束

12月14日 12:00 复赛B榜公布

12月15日 开始审核

12月18日 公布最终排名

12月28日 线下决赛

 



参赛与组队规则

所有参赛人员及队伍,视为已同意《DC竞赛作弊管理规则》及其他相关规定。队长对其队员的参赛行为负责。

1.大赛面向全社会开放,组队上限人数3人。 2.参赛队伍可以是单人组队或自由组合,每人只能参加一支队伍。 3.每支队伍至少有一名在校学生。 4.入围复赛的250支队伍需全员实名认证,否则入围资格顺延。 注:大赛主办和技术支持单位能接触到相关数据的员工禁止参赛


扫描下方二维码加入赛事交流群:868718746



团队人数上限 3 人。 在第一阶段的最后3天无法新建队伍,但是可以加入其它队伍。 在最后一个阶段最后3天无法新建队伍,无法加入队伍。 竞赛进入历史阶段后可以新建队伍,但是已参赛队伍不可新增队员、不可解散队伍,注意:答辩队伍成员仅限活跃期间加入的成员。

评分标准

评分算法
other

在黑产监控中,需要尽可能做到尽可能少的误伤和尽可能准确地探测,于是我们选择“在FPR较低时的TPR加权平均值”作为平均指标。

(FPR和TPR的定义请点击链接 ) 

 页末有前辈的代码 给定一个阀值,可根据混淆矩阵计算TPR(覆盖率)和FPR(打扰率) TPR = TP /(TP + FN) FPR = FP /(FP + TN) 其中,TP、FN、FP、TN分别为真正例、假反例、假正例、真反例。 通过设定不同的阈值,会有一系列TPR和FPR,就可以绘制出ROC曲线


这里的评分指标,首先计算了3个覆盖率TPR: TPR1:FPR=0.001时的TPR TPR2:FPR=0.005时的TPR TPR3:FPR=0.01时的TPR 最终成绩= 0.4 * TPR1 + 0.3 * TPR2 + 0.3 * TPR3 前辈的代码如下:点击链接

def tpr_weight_funtion(y_true,y_predict):
    d = pd.DataFrame()
    d['prob'] = list(y_predict)
    d['y'] = list(y_true)
    d = d.sort_values(['prob'], ascending=[0])
    y = d.y
    PosAll = pd.Series(y).value_counts()[1]
    NegAll = pd.Series(y).value_counts()[0]
    pCumsum = d['y'].cumsum()
    nCumsum = np.arange(len(y)) - pCumsum + 1
    pCumsumPer = pCumsum / PosAll
    nCumsumPer = nCumsum / NegAll
    TR1 = pCumsumPer[abs(nCumsumPer-0.001).idxmin()]
    TR2 = pCumsumPer[abs(nCumsumPer-0.005).idxmin()]
    TR3 = pCumsumPer[abs(nCumsumPer-0.01).idxmin()]
    return 0.4 * TR1 + 0.3 * TR2 + 0.3 * TR3


A/B榜划分 初赛数据集不划分A/B榜,复赛划分A/B榜 复赛A榜为测试集前随机抽取50%的数据,B榜为测试集另外50%的数据。选手需提交测试集的全部数据。比赛结束前线上排行榜显示即为A榜成绩,竞赛结束后2小时切换成B榜单,最终成绩由B榜排名决定。 比赛结束前选手自选两份提交文件(或系统默认选择最后两次提交文件)作为B榜文件,两份文件中的最高分即为B榜分数  。




技术共享 官方QQ群

快分享给朋友吧!

×

抢150元大礼包

意见反馈
关注微信公众号 关注微信公众号
  • © 2013-2018 DataCastle 蜀ICP备17028166号-1

扫一扫分享给周围朋友