近年来,随着GAN、扩散模型等生成模型的提出,人工智能生成内容(AIGC)技术引起了广泛关注。在这个领域中,漫画生成是一个重要的应用方向,在日常生活中几乎随处可见,因此对漫画图像的识别具有重要的实际应用价值。然而,受制漫画绘制的复杂性和困难性,通常只能收集少量的漫画图像可供于训练,这对于传统的深度学习算法而言有较大的困难。因此,小样本学习成为解决这一问题的有效方法。相对于传统的大数据量下的机器学习分类问题,小样本学习算法因其能够仅利用有限数据实现快速适应新任务的特性而备受关注,这弥补了深度学习对数据的高度依赖。为了满足实际任务需求,本赛题使用漫画人脸数据集,要求参赛者利用小样本学习相关技术,在5-way 5-shot和5-way 1-shot两个经典小样本场景下完成漫画人脸的识别任务。
参赛者需利用小样本学习相关技术,在5-way 5-shot(5个类别,每个类别5个训练样本)和5-way 1-shot(5个类别,每个类别1个训练样本)两个小样本任务场景分别建立一个高效的漫画人脸识别模型。模型应能够根据测试集中的漫画人脸图像,准确地将它们分类到对应的漫画类别。
数据来源于WebCaricature数据集,原数据集共包括属于252个人物的6042幅漫画照片。我们将数据集分割为训练集,验证集和测试集,其中训练集有200个类别,验证集有32个类别,测试集暂不提供。同时由于所有的漫画图片均来自网络爬虫爬取,因此数据集中的漫画的艺术风格是多种多样。此外,该数据集中也并不对光照条件、姿态、表情、遮挡和年龄等信息进行约束。
WebCaricature/images |
训练集图片文件夹,包含数据集中所有的图片 |
WebCaricature/train.csv |
含有数据训练集信息的表格文件,其中每行有两列,分别为filename和label,对应images文件夹下的图片名和所属类别 |
WebCaricature/val.csv |
含有数据验证集信息的表格文件,内容格式与train.csv一致 |
参赛队员需仿造参考资源中提供的开源库,分别提交5-way 5-shot和5-way 1-shot两个场景下训练完成后的模型权重,赛方会基于该开源库提供的测试接口对模型的算法能力进行评估。
在评测阶段,赛方会对两个场景下的算法能力进行评估。具体而言,赛方会将测试集图像进行划分,在5-way 5-shot和5-way 1-shot两个小样本场景下随机模拟生成若干个任务,计算在每个任务的Top-1分类精度。最终使用同一个场景下所有任务的Top-1分类精度的平均值作为该场景下的分类精度。
数据集获取以及小样本学习相关算法实现可参考https://github.com/RL-VIG/LibFewShot
参赛QQ群:815232826