Imparare a descrivere gli oggetti salienti presenti nelle immagini tramite la visione e il linguaggio