Wiki-LLaVA: Hierarchical Retrieval-Augmented Generation for Multimodal LLMs / Caffagni, Davide; Cocchi, Federico; Moratelli, Nicholas; Sarto, Sara; Cornia, Marcella; Baraldi, Lorenzo; Cucchiara, Rita. - (2024), pp. 1818-1826. (Intervento presentato al convegno 2024 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops, CVPRW 2024 tenutosi a Seattle, USA nel Jun 17-21 2024) [10.1109/CVPRW63382.2024.00188].
Wiki-LLaVA: Hierarchical Retrieval-Augmented Generation for Multimodal LLMs
Caffagni, Davide;Cocchi, Federico;Moratelli, Nicholas;Sarto, Sara;Cornia, Marcella;Baraldi, Lorenzo;Cucchiara, Rita
2024
File in questo prodotto:
File | Dimensione | Formato | |
---|---|---|---|
2024_CVPRW_Wiki_LLaVA.pdf
Open access
Tipologia:
Versione dell'autore revisionata e accettata per la pubblicazione
Dimensione
995.18 kB
Formato
Adobe PDF
|
995.18 kB | Adobe PDF | Visualizza/Apri |
Pubblicazioni consigliate
I metadati presenti in IRIS UNIMORE sono rilasciati con licenza Creative Commons CC0 1.0 Universal, mentre i file delle pubblicazioni sono rilasciati con licenza Attribuzione 4.0 Internazionale (CC BY 4.0), salvo diversa indicazione.
In caso di violazione di copyright, contattare Supporto Iris