报名参赛
2017中国高校计算机大赛——大数据挑战赛(Big Data Challenge)是由教育部高等学校计算机类专业教学指导委员会、软件工程专业教学指导委员会、计算机课程教学指导委会和全国高等学校计算机教育研究联合主办,清华大学和腾讯安全平台部联合承办,在腾讯DIX平台上开展的高端算法竞赛。大赛面向全球高校在校生开放,旨在通过竞技的方式提升人们对数据分析与处理的算法研究与技术应用能力,探索大数据的核心科学与技术问题,尝试创新大数据技术,推动大数据的产学研用,本次大赛鼓励高校导师参与指导 。

本次大赛以某人机验证产品采集的鼠标轨迹脱敏数据为基础,期望参赛队伍通过算法设计和数据分析,检测发现其中的机器轨迹,具体赛题描述见“赛题与数据”版块。比赛结果按照规定的评价指标使用在线评测程序进行评阅和排名,结果最优者获胜。
本次大赛分为初赛、复赛和决赛三个阶段,其中初赛由参赛队伍下载数据在本地进行算法设计和调试,并通过大赛报名官网提交结果文件;复赛要求参赛者在腾讯DIX平台进行数据分析和处理,可使用基于Spark、XGBoost 及平台提供的机器学习相关基础算法;决赛要求参赛者进行现场演示和答辩。具体安排和要求如下:
5月26日——7月21日
初赛
1

参赛队伍可从大赛官方网站下载数据,在本地进行算法设计和调试,规定时间内在报名官网提交结果,每支队伍每天只能提交一次结果;

5月26日起系统向选手开放训练样本数据3000 条(2600正常轨迹样本,400条机器轨迹样本)供参赛者下载进行建模和模型优化,同时提供正式比赛数据10 万条供参赛者下载评测;

每天10:00AM 进行一次评测,根据参赛队伍目前为止最优成绩进行排名展示;

初赛截止时间(7月21日10:00AM),排名前200的队伍将进入复赛。

7月22日——8月11日
复赛
2

所有比赛数据不可下载,选手需在腾讯DIX平台上完成数据处理、建模、算法调试、产出结果等所有环节,可使用基于Spark、XGBoost 及平台提供的机器学习相关基础算法;

7月22日起系统提供200万条正式比赛数据(对参赛选手不可见,仅供平台对参赛作品进行评测);

每天10:00 AM 按照评测指标进行一次评测,并根据参赛队伍目前为止最优成绩进行排名展示;

排名前10的队伍将受邀参加决赛答辩会。

8月20日
决赛
3

决赛将以现场答辩会的形式进行,具体安排另行通知;

参赛队伍应提前准备现场答辩材料,包括PPT、算法代码;

组委会将根据参赛队伍的算法原理、历史成绩和评委打分,评选出整个大数据挑战赛的冠亚季军,并现场颁发奖金及证书。

本次大赛面向在校学生(包括高职高专、本科、研究生及以上),具体参赛队伍如下要求:

参赛队伍要求:

  • 可以单人参赛或自由组队(最多不超过3人,可以跨单位组队)。
  • 每人只能参加一支队伍。
  • 保证参赛队员报名信息准确有效,否则将被取消参赛资格及奖励。
  • 大赛主办单位和技术支持单位中有机会接触赛题相关数据的人员不允许参赛。
  • 提交的参赛作品必须是团队或个人独立完成的原创作品,不得抄袭,不得违反任何相关的法律法规,否则将取消参赛资格。
  • 大赛所提供的数据集和平台仅限于此次大赛使用,不得用于其他任何目的。若因违反此规定而给数据提供方或平台提供方造成损失的,参赛队伍所在单位和选手须承担全部责任。
初赛
复赛
决赛
教育部高等学校计算机类专业教学指导委员会
教育部高等学校软件工程专业教学指导委员会
教育部高等学校大学计算机课程教学指导委员会
全国高等学校计算机教育研究会
承办单位
清华大学
赞助单位
腾讯安全平台部
技术支持
大学生竞赛平台-赛氪