VoxCeleb2包括从YouTube上提取的超过6000位名人,一百万段语音的片段utterances。
说话者覆盖到了不同年龄、性别、口音。语音的场景也非常丰富,包括红毯走秀、室外场馆、室内录影棚等;声音采集设备包括专业与手持端,背景噪声有交谈声、笑声以及不同的场景效应。总的来说,VoxCeleb2 数据表现十分丰富。
下图给出了一些基本的统计:
从时长、性别、国籍等分布上都有比较好的覆盖。下图与 VoxCeleb1的比较:
可以看到,数据集的体量已经大了许多倍。
音频版本下载地址
voxceleb1
链接:https://pan.baidu.com/s/1iASZ01mUny7udnjChJIbOg
提取码:k7v0
voxceleb2
链接:https://pan.baidu.com/s/1tBbdq2tm5KX7znM89o9LHg
提取码:6hzs
ZEngX-cdut分享
VoxCeleb2 的视频版本很大
解压后如图