[论文翻译]SCAN: 无需标注的图像分类学习
在缺乏真实标注的情况下,我们能否自动将图像分组为有语义意义的簇?无监督图像分类任务仍然是计算机视觉领域中一个重要且开放的挑战。最近的一些方法尝试以端到端的方式解决这个问题。在本文中,我们与近期工作不同,提倡采用两步法,将特征学习与聚类解耦。首先,利用表征学习中的自监督任务来获取具有语义意义的特征。其次,我们将这些特征作为可学习聚类方法中的先验。通过这种方式,我们消除了聚类学习依赖低级特征的可能性,而这在当前端到端学习方法中是存在的。实验评估表明,我们的方法大幅领先于现有最优方法,具体而言,在分类准确率上,CIFAR10提高了+26.6%,CIFAR100-20提高了+25.0%,STL10提高了+21.3%。此外,我们的方法是首个在大型图像分类数据集上表现良好的方法。特别是在ImageNet上,我们取得了有希望的结果,并在低数据量情况下,不使用任何真实标注的情况下,优于几种半监督学习方法。代码已公开在此处。