L’intelligenza artificiale generativa e la conservazione digitale del patrimonio culturale islamico: approcci “Humanists-in-the-Loop” per la mitigazione degli errori indotti dall’IA

El Ganadi, Amina

This dissertation examines AI-induced errors in generative AI systems, often mislabelled as “hallucinations,” and their implications for the digital preservation and scholarly study of Islamic heritage. It systematically maps and compares competing labels, confabulation, fabrication, delusion, and “bullshit,” and adopts AI-induced error as a neutral umbrella for conceptual and evaluative consistency. Building on this terminological foundation, the study identifies and classifies recurring forms of AI-induced error to establish a comprehensive, risk-aware framework for evaluation and oversight. These include fabrication, citation invention, and unsafe suggestion, as well as broader categories of contextual distortion, referring to semantic and interpretive drift within translation and exegesis, and classificatory misalignment, referring to structural errors in topic assignment and metadata enrichment. Together, these categories capture both factual and structural modes of generative unreliability, providing a systematic basis for analysing AI behaviour across corpus-bounded reasoning, linguistic translation, and digital library workflows. Methodologically, the dissertation advances a humanists-in-the-loop (HITL) framework in which expert oversight is treated as an epistemic necessity. Three linked case studies progress from source-grounded Q&A in a single corpus (Bukhari GPT), to testing philological and theological ambiguity in translation, to constraining collection-level topic assignment through the subject taxonomy of the Giorgio La Pira Library (Digital Maktaba Project). Located in Palermo, the La Pira Library houses a major collection on Islamic history, theology, and doctrine, providing the primary corpus for evaluating metadata alignment, topic classification, and digital preservation strategies within the broader framework of responsible AI for cultural heritage collections. Taken together, the findings demonstrate that AI-induced errors can be mitigated but not eliminated, and that sustained humanist oversight remains essential to ensure that generative AI functions as an assistive, interpretable, and culturally responsible tool for the digital preservation of Islamic heritage. Developed within the ITSERR/RESILIENCE research infrastructure and coordinated by FSCIRE (Fondazione per le Scienze Religiose) in collaboration with the University of Modena and Reggio Emilia and the University of Palermo, this dissertation forms an integral component of the Digital Maktaba Project. Within this broader initiative, which aims to build a digital library and replicable methodologies for the digitization and cataloguing of Arabic-script collections, the dissertation contributes the theoretical and methodological foundations for managing AI-induced errors in large language models (LLMs). It thus links the epistemological analysis of AI error mitigation with the applied objectives of building transparent and accountable AI systems for digital libraries and cultural heritage preservation.

La tesi esamina gli errori indotti dall’intelligenza artificiale (AI-induced errors) nei sistemi di intelligenza artificiale generativa, spesso erroneamente definiti “allucinazioni”, analizzandone le implicazioni per la conservazione digitale e lo studio accademico del patrimonio islamico. A partire da questo inquadramento, la ricerca analizza e confronta in modo sistematico i termini alternativi quali confabulazione, fabbricazione, illusione e “bullshit”, adottando “errore indotto dall’IA” come categoria neutra volta a garantire coerenza concettuale e valutativa. Su questa base terminologica, la ricerca identifica e classifica le principali forme ricorrenti di errore indotto dall’IA, delineando un quadro analitico completo e consapevole delle loro implicazioni, utile ai fini della valutazione e della supervisione. Tra queste figurano la fabbricazione, l’invenzione di citazioni e la generazione di output inappropriati o fuorvianti da parte di modelli di intelligenza artificiale, oltre a categorie più ampie come la distorsione contestuale, che si riferisce a derive semantiche e interpretative nella traduzione e nell’esegesi, e l’errore di classificazione, che riguarda gli errori strutturali nell’assegnazione di argomenti o nell’arricchimento dei metadati. Insieme, tali categorie catturano le modalità fattuali e strutturali dell’inaffidabilità generativa, fornendo una base sistematica per analizzare il comportamento dell’IA generativa in ambiti quali il ragionamento vincolato al corpus, la traduzione linguistica e i flussi di lavoro delle biblioteche digitali. Dal punto di vista metodologico, la tesi propone un quadro “Humanists-in-the-Loop” (HITL), in cui la supervisione esperta è trattata come una necessità epistemica. Tre casi di studio collegati illustrano progressivamente l’applicazione di questo approccio: dall’elaborazione di domande e risposte fondata su un corpus unico di hadith (Bukhari GPT), alla verifica delle ambiguità filologiche e teologiche nella traduzione, fino alla definizione dell’assegnazione tematica a livello di collezione attraverso la tassonomia tematica della biblioteca “Giorgio La Pira” (Digital Maktaba Project). La biblioteca La Pira di Palermo custodisce un’ampia collezione dedicata alla storia, alla teologia e alla dottrina islamica. Questo patrimonio costituisce il corpus principale di un progetto di ricerca che valuta l’allineamento dei metadati, la classificazione tematica e le pratiche di conservazione digitale. La ricerca si inserisce nel quadro più ampio dell'impiego responsabile dell'intelligenza artificiale nei processi di digitalizzazione del patrimonio culturale, utilizzando la collezione bibliografica islamica come caso di studio centrale. Nel complesso, i risultati dimostrano che gli errori indotti dall’intelligenza artificiale possono essere mitigati, ma non eliminati, e che una costante supervisione da parte di studiosi umanisti resta essenziale affinché l’intelligenza artificiale generativa operi come strumento ausiliario e interpretabile. Sviluppata nell’ambito dell’infrastruttura di ricerca ITSERR/RESILIENCE e coordinata da FSCIRE (Fondazione per le Scienze Religiose), in collaborazione con l’Università di Modena e Reggio Emilia e l’Università di Palermo, questa tesi costituisce una componente essenziale del Digital Maktaba Project. La ricerca contribuisce a definire i fondamenti teorici e metodologici per la gestione degli errori indotti dall’intelligenza artificiale nei grandi modelli linguistici (LLM). Il lavoro integra la riflessione teorica sulla mitigazione degli errori dell’intelligenza artificiale con gli obiettivi applicativi del progetto, orientati allo sviluppo di sistemi e metodologie replicabili, fondati su un uso trasparente e consapevole dell’intelligenza artificiale.

L’intelligenza artificiale generativa e la conservazione digitale del patrimonio culturale islamico: approcci “Humanists-in-the-Loop” per la mitigazione degli errori indotti dall’IA / Amina El Ganadi , 2026 May 06. 38. ciclo, Anno Accademico 2024/2025.

L’intelligenza artificiale generativa e la conservazione digitale del patrimonio culturale islamico: approcci “Humanists-in-the-Loop” per la mitigazione degli errori indotti dall’IA

EL GANADI, AMINA

2026

Abstract

This dissertation examines AI-induced errors in generative AI systems, often mislabelled as “hallucinations,” and their implications for the digital preservation and scholarly study of Islamic heritage. It systematically maps and compares competing labels, confabulation, fabrication, delusion, and “bullshit,” and adopts AI-induced error as a neutral umbrella for conceptual and evaluative consistency. Building on this terminological foundation, the study identifies and classifies recurring forms of AI-induced error to establish a comprehensive, risk-aware framework for evaluation and oversight. These include fabrication, citation invention, and unsafe suggestion, as well as broader categories of contextual distortion, referring to semantic and interpretive drift within translation and exegesis, and classificatory misalignment, referring to structural errors in topic assignment and metadata enrichment. Together, these categories capture both factual and structural modes of generative unreliability, providing a systematic basis for analysing AI behaviour across corpus-bounded reasoning, linguistic translation, and digital library workflows. Methodologically, the dissertation advances a humanists-in-the-loop (HITL) framework in which expert oversight is treated as an epistemic necessity. Three linked case studies progress from source-grounded Q&A in a single corpus (Bukhari GPT), to testing philological and theological ambiguity in translation, to constraining collection-level topic assignment through the subject taxonomy of the Giorgio La Pira Library (Digital Maktaba Project). Located in Palermo, the La Pira Library houses a major collection on Islamic history, theology, and doctrine, providing the primary corpus for evaluating metadata alignment, topic classification, and digital preservation strategies within the broader framework of responsible AI for cultural heritage collections. Taken together, the findings demonstrate that AI-induced errors can be mitigated but not eliminated, and that sustained humanist oversight remains essential to ensure that generative AI functions as an assistive, interpretable, and culturally responsible tool for the digital preservation of Islamic heritage. Developed within the ITSERR/RESILIENCE research infrastructure and coordinated by FSCIRE (Fondazione per le Scienze Religiose) in collaboration with the University of Modena and Reggio Emilia and the University of Palermo, this dissertation forms an integral component of the Digital Maktaba Project. Within this broader initiative, which aims to build a digital library and replicable methodologies for the digitization and cataloguing of Arabic-script collections, the dissertation contributes the theoretical and methodological foundations for managing AI-induced errors in large language models (LLMs). It thus links the epistemological analysis of AI error mitigation with the applied objectives of building transparent and accountable AI systems for digital libraries and cultural heritage preservation.

Scheda breve

Scheda completa

Scheda completa (DC)

	Titolo in inglese
	
				Generative AI and the Digital Preservation of Islamic Heritage: Humanists-in-the-Loop Approaches to Mitigating AI-Induced Errors
			
	Anno di discussione
	
				6-mag-2026
			
	Tipologia
	
				Tesi di dottorato

File in questo prodotto:

File	Dimensione	Formato
ElGanadi.pdf embargo fino al 05/11/2027 Descrizione: ElGanadi.Amina.pdf Tipologia: Tesi di dottorato Dimensione 7.07 MB Formato Adobe PDF Visualizza/Apri Richiedi una copia	7.07 MB	Adobe PDF	Visualizza/Apri Richiedi una copia

Pubblicazioni consigliate

I metadati presenti in IRIS UNIMORE sono rilasciati con licenza Creative Commons CC0 1.0 Universal, mentre i file delle pubblicazioni sono rilasciati con licenza Attribuzione 4.0 Internazionale (CC BY 4.0), salvo diversa indicazione.
In caso di violazione di copyright, contattare Supporto Iris