Metodologie di Visione Artificiale per la Digitalizzazione e l’Interpretazione 3D

Di Nucci, Davide

Processing and interpreting three-dimensional data remain fundamental challenges in Computer Vision and Computer Graphics, with applications spanning autonomous driving, robotics, augmented reality, and digital security. Accurate 3D reconstruction is essential for enabling machines to perceive and interact with the physical world, yet achieving high-fidelity results under real-world constraints such as sparse viewpoints, variable illumination, and complex object geometries remains demanding. This doctoral thesis addresses these challenges by focusing on the reconstruction, representation, and authentication of 3D scenes and vehicles, proposing innovative solutions grounded in neural fields and differentiable rasterization techniques. The research builds upon the Gaussian Splatting paradigm, a powerful alternative to traditional volumetric representations for real-time rendering and reconstruction. Unlike Neural Radiance Fields (NeRF), which require dense sampling and extensive optimization, Gaussian Splatting offers superior efficiency and scalability, making it particularly suitable for automotive scenarios where data acquisition is often limited to sparse camera views. The proposed methods extend this paradigm to handle outdoor environments and vehicle-specific constraints, introducing strategies for robust geometry recovery under challenging lighting conditions and partial occlusions. Additionally, the thesis explores the integration of parametric models to regularize shape estimation and improve pose accuracy, enabling the reconstruction of articulated structures and fine-grained details critical for downstream tasks such as simulation, inspection, and virtual prototyping. Beyond algorithmic development, this work contributes to the research ecosystem through the creation of dedicated datasets tailored to real-world vehicle scenarios. These datasets capture diverse conditions—including varying illumination, weather, and occlusion patterns—providing a rigorous benchmark for evaluating reconstruction fidelity and generalization. Complementing this effort, the thesis introduces advanced evaluation metrics that go beyond traditional photometric error, incorporating measures of structural consistency, geometric plausibility, and perceptual realism to better reflect industrial and safety-critical requirements. A distinctive dimension of this research addresses the emerging challenge of fake detection in 3D. As generative models become increasingly capable of producing photorealistic and geometrically plausible content, distinguishing authentic reconstructions from synthetic or manipulated data is crucial for maintaining trust in digital communication and forensic analysis. The thesis proposes a principled framework for assessing visual authenticity in three dimensions. Practical applications include reliable indicators for identifying 3D deepfakes and malicious manipulations, which pose growing risks in domains such as automotive security, insurance fraud detection, and virtual asset verification. Overall, the integration of Gaussian Splatting, parametric modeling, and authenticity assessment represents a promising direction for advancing the fidelity, robustness, and trustworthiness of 3D reconstruction systems. By addressing both technical and conceptual challenges, this work contributes to the scientific foundations of 3D vision while offering practical solutions for industrial deployment and digital security.

L’elaborazione e l’interpretazione dei dati tridimensionali rappresentano tuttora sfide fondamentali nell’ambito della Computer Vision e della Computer Graphics, con applicazioni che spaziano dalla guida autonoma alla robotica, dalla realtà aumentata alla sicurezza digitale. Una ricostruzione 3D accurata è essenziale per consentire alle macchine di percepire e interagire con il mondo fisico; tuttavia, ottenere risultati di elevata fedeltà in presenza di vincoli reali — come punti di vista sparsi, illuminazione variabile e geometrie complesse degli oggetti — rimane un compito impegnativo. Questa tesi di dottorato affronta tali sfide concentrandosi sulla ricostruzione, rappresentazione e autenticazione di scene e veicoli tridimensionali, proponendo soluzioni innovative basate su campi neurali e tecniche di rasterizzazione differenziabile. La ricerca si fonda sul paradigma della Gaussian Splatting, un’alternativa efficace alle rappresentazioni volumetriche tradizionali per la resa e la ricostruzione in tempo reale. A differenza dei Neural Radiance Fields (NeRF), che richiedono un campionamento denso e una lunga fase di ottimizzazione, la Gaussian Splatting offre maggiore efficienza e scalabilità, risultando particolarmente adatta a contesti automotive, dove l’acquisizione dei dati è spesso limitata a pochi punti di vista. I metodi proposti estendono questo paradigma per gestire ambienti esterni e vincoli specifici dei veicoli, introducendo strategie per un recupero robusto della geometria anche in condizioni di illuminazione complessa e occlusioni parziali. Inoltre, la tesi esplora l’integrazione di modelli parametrici per regolarizzare la stima della forma e migliorare la precisione della posa, consentendo la ricostruzione di strutture articolate e di dettagli fini fondamentali per applicazioni successive come simulazione, ispezione e prototipazione virtuale. Oltre allo sviluppo algoritmico, questo lavoro contribuisce alla comunità scientifica attraverso la creazione di dataset dedicati a scenari veicolari reali. Tali dataset includono condizioni diversificate — come variazioni di illuminazione, meteo e schemi di occlusione — fornendo un benchmark rigoroso per valutare la fedeltà e la capacità di generalizzazione dei metodi di ricostruzione. A completamento di questo contributo, la tesi introduce metriche di valutazione avanzate che superano il tradizionale errore fotometrico, includendo misure di coerenza strutturale, plausibilità geometrica e realismo percettivo, al fine di riflettere meglio i requisiti dei contesti industriali e di sicurezza. Una dimensione distintiva di questa ricerca riguarda la rilevazione di contenuti falsificati in 3D. Con l’aumento delle capacità dei modelli generativi di produrre contenuti fotorealistici e geometricamente coerenti, diventa cruciale distinguere le ricostruzioni autentiche da quelle sintetiche o manipolate per mantenere la fiducia nella comunicazione digitale e nell’analisi forense. La tesi propone un quadro metodologico per la valutazione dell’autenticità visiva tridimensionale, con applicazioni pratiche che includono indicatori affidabili per l’individuazione di deepfake 3D e manipolazioni malevole, fenomeni sempre più rilevanti in ambiti come la sicurezza automobilistica, la rilevazione di frodi assicurative e la verifica di asset digitali. Nel complesso, l’integrazione di Gaussian Splatting, modellazione parametrica e valutazione dell’autenticità rappresenta una direzione promettente per migliorare la fedeltà, la robustezza e l’affidabilità dei sistemi di ricostruzione tridimensionale. Affrontando al contempo sfide tecniche e concettuali, questo lavoro contribuisce alle fondamenta scientifiche della visione 3D e offre soluzioni pratiche per l’implementazione industriale e la sicurezza digitale.

Metodologie di Visione Artificiale per la Digitalizzazione e l’Interpretazione 3D / Davide Di Nucci , 2026 Apr 20. 38. ciclo, Anno Accademico 2024/2025.

Metodologie di Visione Artificiale per la Digitalizzazione e l’Interpretazione 3D

DI NUCCI, DAVIDE

2026

Abstract

Processing and interpreting three-dimensional data remain fundamental challenges in Computer Vision and Computer Graphics, with applications spanning autonomous driving, robotics, augmented reality, and digital security. Accurate 3D reconstruction is essential for enabling machines to perceive and interact with the physical world, yet achieving high-fidelity results under real-world constraints such as sparse viewpoints, variable illumination, and complex object geometries remains demanding. This doctoral thesis addresses these challenges by focusing on the reconstruction, representation, and authentication of 3D scenes and vehicles, proposing innovative solutions grounded in neural fields and differentiable rasterization techniques. The research builds upon the Gaussian Splatting paradigm, a powerful alternative to traditional volumetric representations for real-time rendering and reconstruction. Unlike Neural Radiance Fields (NeRF), which require dense sampling and extensive optimization, Gaussian Splatting offers superior efficiency and scalability, making it particularly suitable for automotive scenarios where data acquisition is often limited to sparse camera views. The proposed methods extend this paradigm to handle outdoor environments and vehicle-specific constraints, introducing strategies for robust geometry recovery under challenging lighting conditions and partial occlusions. Additionally, the thesis explores the integration of parametric models to regularize shape estimation and improve pose accuracy, enabling the reconstruction of articulated structures and fine-grained details critical for downstream tasks such as simulation, inspection, and virtual prototyping. Beyond algorithmic development, this work contributes to the research ecosystem through the creation of dedicated datasets tailored to real-world vehicle scenarios. These datasets capture diverse conditions—including varying illumination, weather, and occlusion patterns—providing a rigorous benchmark for evaluating reconstruction fidelity and generalization. Complementing this effort, the thesis introduces advanced evaluation metrics that go beyond traditional photometric error, incorporating measures of structural consistency, geometric plausibility, and perceptual realism to better reflect industrial and safety-critical requirements. A distinctive dimension of this research addresses the emerging challenge of fake detection in 3D. As generative models become increasingly capable of producing photorealistic and geometrically plausible content, distinguishing authentic reconstructions from synthetic or manipulated data is crucial for maintaining trust in digital communication and forensic analysis. The thesis proposes a principled framework for assessing visual authenticity in three dimensions. Practical applications include reliable indicators for identifying 3D deepfakes and malicious manipulations, which pose growing risks in domains such as automotive security, insurance fraud detection, and virtual asset verification. Overall, the integration of Gaussian Splatting, parametric modeling, and authenticity assessment represents a promising direction for advancing the fidelity, robustness, and trustworthiness of 3D reconstruction systems. By addressing both technical and conceptual challenges, this work contributes to the scientific foundations of 3D vision while offering practical solutions for industrial deployment and digital security.

Scheda breve

Scheda completa

Scheda completa (DC)

	Titolo in inglese
	
				Methodologies in Computer Vision for 3D Digitization and Interpretation
			
	Anno di discussione
	
				20-apr-2026
			
	Tutor afferenti all'Ateneo
	
				CUCCHIARA, Rita
VEZZANI, Roberto
			
	Tipologia
	
				Tesi di dottorato

File in questo prodotto:

File	Dimensione	Formato
dinucci.pdf Open access Descrizione: dinucci.davide.pdf Tipologia: Tesi di dottorato Dimensione 13.14 MB Formato Adobe PDF Visualizza/Apri	13.14 MB	Adobe PDF	Visualizza/Apri

Pubblicazioni consigliate

I metadati presenti in IRIS UNIMORE sono rilasciati con licenza Creative Commons CC0 1.0 Universal, mentre i file delle pubblicazioni sono rilasciati con licenza Attribuzione 4.0 Internazionale (CC BY 4.0), salvo diversa indicazione.
In caso di violazione di copyright, contattare Supporto Iris