Report copyright - Large-Scale Adversarial Training for Vision-and-Language ... · such as Visual Question Answering (VQA) [4, 15], Visual Commonsense Reasoning (VCR) [72], and Referring Expression

Please pass captcha verification before submit form