
2040张图片训练出的ViT,准确率96.7%,连迁移性能都令人惊讶
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 ViT在计算机视觉领域取得了巨大的成功,甚至大有取代CNN之势。 但是相比CNN,训练ViT需要更多的数据,通常要在大型数据集JFT-300M或至少在ImageN...
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 ViT在计算机视觉领域取得了巨大的成功,甚至大有取代CNN之势。 但是相比CNN,训练ViT需要更多的数据,通常要在大型数据集JFT-300M或至少在ImageN...