Problems with data that have a natural origin require specific data analysis techniques. In this thesis we develop new mathematical and computer science models to work, specifically, with data with natural origin, and we apply them to the study of water, food, and atmospheric resources. Specifically, we focus on designing dynamic pre-processing techniques seen as multivariate optimization problems, to improve the performance of learning algorithms and the interpretability of their results. We obtain a comprehensive methodology that includes feature selection, outlier detection, lag selection and, in a limited way, feature engineering, and we give it a mathematical formalization, which allows us to study its properties and generalizations. At the other end of the optimization process we use classical regression, classification and clustering algorithms, and we focus on evolutionary algorithms (specifically, the well-known algorithm NSGA-II) to perform the optimizations themselves. By applying our method, in general we obtain more relevant and interpretable results than those already existing in literature, and we are able to solve problems that could not be tackled with classical tools. To show that our methods can be applied to a variety of real-world situations, we consider problems of environmental pollution, characterization of aquifers, detection of illegal fishing, characterization of medieval buildings, and identification of local-production olive oils; all such problems, and their data, come from existing, real, and current projects of different nature.

I problemi con dati di origine naturale richiedono tecniche di analisi dei dati specifiche. In questa tesi sviluppiamo nuovi modelli matematici e informatici per lavorare con dati di origine naturale, che applichiamo all'ottimizzazione delle risorse idriche, alimentari e atmosferiche. Nello specifico, ci concentriamo sulla progettazione di tecniche di pre-elaborazione dinamiche viste come problemi di ottimizzazione multivariata, per migliorare le prestazioni degli algoritmi di apprendimento e l'interpretabilità dei loro risultati. Abbiamo applicato le nostre tecniche allo studio dell'inquinamento ambientale, alla caratterizzazione delle falde acquifere, alla rilevazione della pesca illegale, alla caratterizzazione geochimica di edifici medievali e all'identificazione delle impronte geochimiche dell'olio d'oliva. Abbiamo progettato una metodologia completa che include la selezione delle variabili, il rilevamento dei valori anomali, la selezione dei ritardi e, in modo limitato, l'ingegneria delle variabili e le abbiamo fornito una formalizzazione matematica, che ci ha permesso di studiarne le proprietà e le generalizzazioni. All'altra estremità del processo di ottimizzazione abbiamo utilizzato algoritmi classici di regressione, classificazione e clustering e ci siamo concentrati su algoritmi evolutivi (in particolare, il noto NSGA-II) per eseguire le stesse ottimizzazioni. Di conseguenza, in generale abbiamo ottenuto risultati più rilevanti e interpretabili di quelli già esistenti in letteratura, e siamo stati in grado di risolvere problemi che non potevano essere affrontati con gli strumenti classici. Infine, mostriamo come i nostri metodi possono essere applicati a una varietà di situazioni del mondo reale.

Nuovi metodi matematici e informatici per l'ottimizzazione dello studio e dello sfruttamento di risorse naturali / Estrella Lucena Sanchez , 2022 Feb 24. 34. ciclo, Anno Accademico 2020/2021.

Nuovi metodi matematici e informatici per l'ottimizzazione dello studio e dello sfruttamento di risorse naturali

LUCENA SANCHEZ, ESTRELLA
2022

Abstract

Problems with data that have a natural origin require specific data analysis techniques. In this thesis we develop new mathematical and computer science models to work, specifically, with data with natural origin, and we apply them to the study of water, food, and atmospheric resources. Specifically, we focus on designing dynamic pre-processing techniques seen as multivariate optimization problems, to improve the performance of learning algorithms and the interpretability of their results. We obtain a comprehensive methodology that includes feature selection, outlier detection, lag selection and, in a limited way, feature engineering, and we give it a mathematical formalization, which allows us to study its properties and generalizations. At the other end of the optimization process we use classical regression, classification and clustering algorithms, and we focus on evolutionary algorithms (specifically, the well-known algorithm NSGA-II) to perform the optimizations themselves. By applying our method, in general we obtain more relevant and interpretable results than those already existing in literature, and we are able to solve problems that could not be tackled with classical tools. To show that our methods can be applied to a variety of real-world situations, we consider problems of environmental pollution, characterization of aquifers, detection of illegal fishing, characterization of medieval buildings, and identification of local-production olive oils; all such problems, and their data, come from existing, real, and current projects of different nature.
New Mathematical and Computer Science Methods for the Optimization of the Study and the Exploitation of Natural Resources
24-feb-2022
File in questo prodotto:
File Dimensione Formato  
Tesi Estrella Lucena.pdf

Open access

Descrizione: New Mathematical and Computer Science Methods for the Optimization of the Study and the Exploitation of Natural Resources
Tipologia: Tesi di dottorato
Dimensione 2.52 MB
Formato Adobe PDF
2.52 MB Adobe PDF Visualizza/Apri
Pubblicazioni consigliate

Licenza Creative Commons
I metadati presenti in IRIS UNIMORE sono rilasciati con licenza Creative Commons CC0 1.0 Universal, mentre i file delle pubblicazioni sono rilasciati con licenza Attribuzione 4.0 Internazionale (CC BY 4.0), salvo diversa indicazione.
In caso di violazione di copyright, contattare Supporto Iris

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11380/1266038
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact