Machine Learning (ML) algorithms pertain to artificial intelligence techniques. The basic idea is to train an algorithm to reproduce accurate and expensive-to-obtain data from a numerical input describing the system. Once the algorithm is trained, it can predict outcomes based on new inputs without executing the original procedure to obtain them. These techniques find application in studying the structure of glassy materials, whose amorphous nature makes it challenging to understand the relationship between composition, structure, and properties. Experimentally, the most widely used technique is nuclear magnetic resonance (NMR). The disordered nature of glasses makes interpreting spectra difficult for complex compositions, relying on atomistic simulations that provide a detailed view of the structure. The most utilized is molecular dynamics (MD), allowing the simulation of glass generation, studying its structure, and relating it to macroscopic properties. MD quality depends on how atomic interactions are expressed, either coded in simple functional forms or calculated using quantum mechanics, such as density functional theory (DFT). In the former case, it is classical MD, a fast but less accurate method, while in the latter case, it is ab-initio MD, highly accurate but limited by computational cost. Properties derived from MD structures can be compared with experimental data. However, simulating NMR spectra requires quantum mechanical calculations. Three ML techniques have been applied to three problems related to the computational simulation of glassy systems, surpassing the state-of-the-art in interatomic potential parameterization, NMR parameter prediction, and ML potential generation. The interatomic potential BMP (Bertani et al. Phys. Rev. Mat 2021) was extended for simulating boron-containing glasses, and the interactions of boron were parameterized using a Bayesian optimization process. This extended potential allows simulating the entire compositional range of borate and borosilicate glass formation, accurately reproducing their structure, confirmed by comparison with experimental neutron diffraction and NMR data. The chemical shielding of nuclei in sodium and magnesium silicate glasses, obtained with DFT calculations, was reproduced using a Least Square Support Vector Kernel Ridge Regression (LSSVKRR) algorithm. The chemical environment of each atom was encoded in numerical descriptors (Smooth Overlap of Atomic Positions), and the algorithm was trained to reproduce the DFT data on structures containing 400 atoms. Once trained, LSSVKRR was applied to structures containing up to 20,000 atoms, surpassing the capabilities of ab-initio calculations. Using the DeePMD program (Wang et al. Com. Phys. Comm. 2018), which employs a neural network to reproduce the energy of a system based on the chemical environment of atoms, an ML potential was generated. This was trained to simulate sodium silicates with compositions ranging from 0 to 50% Na2O, achieving accuracy similar to DFT but with computational cost comparable to classical MD. This potential can reproduce the structure of glasses across the compositional range, outperforming classical potentials. The agreement with experimental data is significantly better than achievable with classical MD, and the time required is orders of magnitude lower than ab-initio MD.

Gli algoritmi di Machine Learning (ML) afferiscono alle tecniche di intelligenza artificiale. L’idea di base è quella di allenare un algoritmo per riprodurre dati accurati e costosi da ottenere partendo da un input numerico che descriva il sistema. Una volta che l’algoritmo è allenato, sarà in grado di prevedere risultati partendo da nuovi input senza eseguire la procedura originale per ottenerli. Queste tecniche possono trovare applicazione nello studio della struttura dei materiali vetrosi la cui natura amorfa ne rende difficile comprendere la relazione tra composizione, struttura e proprietà. Sperimentalmente, la tecnica più utilizzata è la risonanza magnetica nucleare (NMR). La natura disordinata dei vetri rende difficile l’interpretazione degli spettri per composizioni complesse e ci si affida a simulazioni atomistiche che possono dare una visione dettagliata della struttura. La più utilizzata è la dinamica molecolare (MD) che permette di mimare il processo di generazione del vetro, studiarne la struttura e metterla in relazione alle proprietà macroscopiche. La qualità della MD dipende da come vengono espresse le interazioni tra gli atomi. Queste possono essere codificate in semplici forme funzionali o calcolate utilizzando conti quantomeccanici utilizzando la teoria del funzionale densità (DFT). Nel primo caso si parla di MD classica che è un metodo veloce ma dall’accuratezza limitata, mentre nel secondo caso si parla di MD ab-initio che è molto accurata ma limitata dal grande costo computazionale. Dalle strutture ottenute tramite la MD è possibile ricavare diverse proprietà e confrontarle con dati sperimentali. La simulazione degli spetti NMR richiede tuttavia calcoli quantomeccanici. Tre tecniche ML sono state applicate ad altrettanti problemi relativi alla simulazione computazionale di sistemi vetrosi permettendo di superare lo stato dell’arte nella parametrizzazione di potenziali interatomici, nella predizione di parametri NMR e nella generazione di un potenziale ML. Il potenziale interatomico BMP (Bertani et al. Phys. Rev. Mat 2021) è stato esteso per la simulazione di vetri contenti il boro e le interazioni di quest’ultimo sono state parametrizzate utilizzando un processo di ottimizzazione Bayesiana. Il potenziale così esteso permette di simulare l’intero range composizionale di formazione di vetri borati e borosilicati riproducendone correttamente la struttura, come confermato dal confronto con dati sperimentali di diffrazione neutronica e NMR. Il chemical shielding dei nuclei contenuti in vetri silicatici di sodio e magnesio ottenuto con calcoli DFT è stato riprodotto utilizzando un algoritmo Least Square Support Vector Kernel Ridge Regression (LSSVKRR). L’intorno chimico di ogni atomo è stato codificato in descrittori numerici (Smooth Overlap of Atomic Positions) e l’algoritmo allenato per riprodurre il dato DFT su strutture contenenti 400 atomi. Una volta allenato, il LSSVKRR è stato applicato a strutture contenenti fino a 20000 atomi surclassando le possibilità dei conti ab-initio. Utilizzando il programma DeePMD (Wang et al. Com. Phys. Comm. 2018), il quale utilizza una rete neurale per riprodurre l’energia di un sistema partendo dall’intorno chimico degli atomi, è stato generato un potenziale ML. Questo è stato allenato per simulare silicati di sodio con composizione che va da 0 al 50% di Na2O ottenendo un’accuratezza simile al DFT ma con costo computazionale nell’ordine della MD classica. Questo potenziale è in grado di riprodurre la struttura dei vetri in tutto il range composizionale surclassando i potenziali classici. L’accordo con dati sperimentali è nettamente superiore a quanto ottenibile con MD classica e il tempo impiegato è di diversi ordini di grandezza inferiore ad una MD ab-initio.

Sfruttamento di tecniche machine learning nella simulazione computazionale di vetri a base ossidica / Marco Bertani , 2024 May 08. 36. ciclo, Anno Accademico 2022/2023.

Sfruttamento di tecniche machine learning nella simulazione computazionale di vetri a base ossidica

BERTANI, MARCO
2024

Abstract

Machine Learning (ML) algorithms pertain to artificial intelligence techniques. The basic idea is to train an algorithm to reproduce accurate and expensive-to-obtain data from a numerical input describing the system. Once the algorithm is trained, it can predict outcomes based on new inputs without executing the original procedure to obtain them. These techniques find application in studying the structure of glassy materials, whose amorphous nature makes it challenging to understand the relationship between composition, structure, and properties. Experimentally, the most widely used technique is nuclear magnetic resonance (NMR). The disordered nature of glasses makes interpreting spectra difficult for complex compositions, relying on atomistic simulations that provide a detailed view of the structure. The most utilized is molecular dynamics (MD), allowing the simulation of glass generation, studying its structure, and relating it to macroscopic properties. MD quality depends on how atomic interactions are expressed, either coded in simple functional forms or calculated using quantum mechanics, such as density functional theory (DFT). In the former case, it is classical MD, a fast but less accurate method, while in the latter case, it is ab-initio MD, highly accurate but limited by computational cost. Properties derived from MD structures can be compared with experimental data. However, simulating NMR spectra requires quantum mechanical calculations. Three ML techniques have been applied to three problems related to the computational simulation of glassy systems, surpassing the state-of-the-art in interatomic potential parameterization, NMR parameter prediction, and ML potential generation. The interatomic potential BMP (Bertani et al. Phys. Rev. Mat 2021) was extended for simulating boron-containing glasses, and the interactions of boron were parameterized using a Bayesian optimization process. This extended potential allows simulating the entire compositional range of borate and borosilicate glass formation, accurately reproducing their structure, confirmed by comparison with experimental neutron diffraction and NMR data. The chemical shielding of nuclei in sodium and magnesium silicate glasses, obtained with DFT calculations, was reproduced using a Least Square Support Vector Kernel Ridge Regression (LSSVKRR) algorithm. The chemical environment of each atom was encoded in numerical descriptors (Smooth Overlap of Atomic Positions), and the algorithm was trained to reproduce the DFT data on structures containing 400 atoms. Once trained, LSSVKRR was applied to structures containing up to 20,000 atoms, surpassing the capabilities of ab-initio calculations. Using the DeePMD program (Wang et al. Com. Phys. Comm. 2018), which employs a neural network to reproduce the energy of a system based on the chemical environment of atoms, an ML potential was generated. This was trained to simulate sodium silicates with compositions ranging from 0 to 50% Na2O, achieving accuracy similar to DFT but with computational cost comparable to classical MD. This potential can reproduce the structure of glasses across the compositional range, outperforming classical potentials. The agreement with experimental data is significantly better than achievable with classical MD, and the time required is orders of magnitude lower than ab-initio MD.
Exploiting machine learning techniques in computational simulations of oxide glasses
8-mag-2024
FAGLIONI, Francesco
PEDONE, Alfonso
File in questo prodotto:
File Dimensione Formato  
Tesi definitiva Bertani Marco.pdf

embargo fino al 08/05/2027

Descrizione: Tesi definitiva Bertani Marco
Tipologia: Tesi di dottorato
Dimensione 8.3 MB
Formato Adobe PDF
8.3 MB Adobe PDF   Visualizza/Apri   Richiedi una copia
Pubblicazioni consigliate

Licenza Creative Commons
I metadati presenti in IRIS UNIMORE sono rilasciati con licenza Creative Commons CC0 1.0 Universal, mentre i file delle pubblicazioni sono rilasciati con licenza Attribuzione 4.0 Internazionale (CC BY 4.0), salvo diversa indicazione.
In caso di violazione di copyright, contattare Supporto Iris

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11380/1338447
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact