The impact of common and rare variants in COVID-19 host genetics has been widely studied. In particular, in Fallerini et al. (Human genetics, 2022, 141, 147–173), common and rare variants were used to define an interpretable machine learning model for predicting COVID-19 severity. First, variants were converted into sets of Boolean features, depending on the absence or the presence of variants in each gene. An ensemble of LASSO logistic regression models was used to identify the most informative Boolean features with respect to the genetic bases of severity. After that, the Boolean features, selected by these logistic models, were combined into an Integrated PolyGenic Score (IPGS), which offers a very simple description of the contribution of host genetics in COVID-19 severity. IPGS leads to an accuracy of 55%–60% on different cohorts, and, after a logistic regression with both IPGS and age as inputs, it leads to an accuracy of 75%. The goal of this paper is to improve the previous results, using not only the most informative Boolean features with respect to the genetic bases of severity but also the information on host organs involved in the disease. In this study, we generalize the IPGS adding a statistical weight for each organ, through the transformation of Boolean features into “Boolean quantum features,” inspired by quantum mechanics. The organ coefficients were set via the application of the genetic algorithm PyGAD, and, after that, we defined two new integrated polygenic scores ((Formula presented.) and (Formula presented.)). By applying a logistic regression with both IPGS, ((Formula presented.) (or indifferently (Formula presented.)) and age as inputs, we reached an accuracy of 84%–86%, thus improving the results previously shown in Fallerini et al. (Human genetics, 2022, 141, 147–173) by a factor of 10%.

Host genetics and COVID-19 severity: increasing the accuracy of latest severity scores by Boolean quantum features / Martelloni, G.; Turchi, A.; Fallerini, C.; Degl'Innocenti, A.; Baldassarri, M.; Olmi, S.; Furini, S.; Renieri, A.; Mari, F.; Daga, S.; Meloni, I.; Bruttini, M.; Croci, S.; Lista, M.; Maffeo, D.; Pasquinelli, E.; Brunelli, G.; Zguro, K.; Serio, V. B.; Antolini, E.; Basso, S. L.; Minetto, S.; Rollo, G.; Rozza, M.; Rina, A.; Tita, R.; Mencarelli, M. A.; Rizzo, C. L.; Pinto, A. M.; Ariani, F.; Montagnani, F.; Tumbarello, M.; Rancan, I.; Fabbiani, M.; Bianchi, F.; Picchiotti, N.; Bargagli, E.; Bergantini, L.; D'Alessandro, M.; Cameli, P.; Bennett, D.; Anedda, F.; Marcantonio, S.; Scolletta, S.; Franchi, F.; Mazzei, M. A.; Guerrini, S.; Conticini, E.; Cantarini, L.; Frediani, B.; Tacconi, D.; Raffaelli, C. S.; Emiliozzi, A.; Feri, M.; Donati, A.; Scala, R.; Guidelli, L.; Spargi, G.; Corridi, M.; Nencioni, C.; Croci, L.; Caldarelli, G. P.; Romani, D.; Piacentini, P.; Bandini, M.; Desanctis, E.; Cappelli, S.; Canaccini, A.; Verzuri, A.; Anemoli, V.; Pisani, M.; Ognibene, A.; Lorubbio, M.; Pancrazzi, A.; Vaghi, M.; Monforte, A. D.; Miraglia, F. G.; Mondelli, M. U.; Mantovani, S.; Bruno, R.; Vecchia, M.; Maffezzoni, M.; Martinelli, E.; Girardis, M.; Busani, S.; Venturelli, S.; Cossarizza, A.; Antinori, A.; Vergori, A.; Rusconi, S.; Siano, M.; Gabrieli, A.; Riva, A.; Francisci, D.; Schiaroli, E.; Pallotto, C.; Parisi, S. G.; Basso, M.; Panese, S.; Baratti, S.; Scotton, P. G.; Andretta, F.; Giobbia, M.; Scaggiante, R.; Gatti, F.; Castelli, F.; Quiros-Roldan, E.; Antoni, M. D.; Zanella, I.; della Monica, M.; Piscopo, C.; Capasso, M.; Russo, R.; Andolfo, I.; Iolascon, A.; Merla, G.; Fiorentino, G.; Carella, M.; Castori, M.; Squeo, G. M.; Aucella, F.; Raggi, P.; Perna, R.; Bassetti, M.; Di Biagio, A.; Sanguinetti, M.; Masucci, L.; Guarnaccia, A.; Valente, S.; Di Florio, A.; Mandala, M.; Giorli, A.; Salerni, L.; Zucchi, P.; Parravicini, P.; Menatti, E.; Trotta, T.; Giannattasio, F.; Coiro, G.; Lena, F.; Lacerenza, G.; Mussini, C.; Tavecchia, L.; Crotti, L.; Parati, G.; Mene, R.; Sanarico, M.; Gori, M.; Raimondi, F.; Stella, A.; Biscarini, F.; Milano, ; Bachetti, T.; La Rovere, M. T.; Bussotti, M.; Ludovisi, S.; Capitani, K.; Dei, S.; Ravaglia, S.; Giliberti, A.; Gori, G.; Artuso, R.; Andreucci, E.; Pagliazzi, A.; Fiorentini, E.; Perrella, A.; Bergomi, P.; Catena, E.; Colombo, R.; Luchi, S.; Morelli, G.; Petrocelli, P.; Iacopini, S.; Modica, S.; Baroni, S.; Micheli, G.; Falcone, M.; Urso, D.; Tiseo, G.; Matucci, T.; Grassi, D.; Ferri, C.; Marinangeli, F.; Brancati, F.; Vincenti, A.; Borgo, V.; Lombardi, S.; Lenzi, M.; Di Pietro, M. A.; Vichi, F.; Romanin, B.; Attala, L.; Costa, C.; Gabbuti, A.; Bellucci, A.; Casprini, P.; Pomara, C.; Esposito, M.; Leoncini, R.; Cirianni, M.; Galasso, L.; Bellini, M. A.; Gabbi, C.. - In: FRONTIERS IN GENETICS. - ISSN 1664-8021. - 15:(2024), pp. 1-19. [10.3389/fgene.2024.1362469]

Host genetics and COVID-19 severity: increasing the accuracy of latest severity scores by Boolean quantum features

Girardis M.;Busani S.;Venturelli S.;Cossarizza A.;Mussini C.;
2024

Abstract

The impact of common and rare variants in COVID-19 host genetics has been widely studied. In particular, in Fallerini et al. (Human genetics, 2022, 141, 147–173), common and rare variants were used to define an interpretable machine learning model for predicting COVID-19 severity. First, variants were converted into sets of Boolean features, depending on the absence or the presence of variants in each gene. An ensemble of LASSO logistic regression models was used to identify the most informative Boolean features with respect to the genetic bases of severity. After that, the Boolean features, selected by these logistic models, were combined into an Integrated PolyGenic Score (IPGS), which offers a very simple description of the contribution of host genetics in COVID-19 severity. IPGS leads to an accuracy of 55%–60% on different cohorts, and, after a logistic regression with both IPGS and age as inputs, it leads to an accuracy of 75%. The goal of this paper is to improve the previous results, using not only the most informative Boolean features with respect to the genetic bases of severity but also the information on host organs involved in the disease. In this study, we generalize the IPGS adding a statistical weight for each organ, through the transformation of Boolean features into “Boolean quantum features,” inspired by quantum mechanics. The organ coefficients were set via the application of the genetic algorithm PyGAD, and, after that, we defined two new integrated polygenic scores ((Formula presented.) and (Formula presented.)). By applying a logistic regression with both IPGS, ((Formula presented.) (or indifferently (Formula presented.)) and age as inputs, we reached an accuracy of 84%–86%, thus improving the results previously shown in Fallerini et al. (Human genetics, 2022, 141, 147–173) by a factor of 10%.
2024
15
1
19
Host genetics and COVID-19 severity: increasing the accuracy of latest severity scores by Boolean quantum features / Martelloni, G.; Turchi, A.; Fallerini, C.; Degl'Innocenti, A.; Baldassarri, M.; Olmi, S.; Furini, S.; Renieri, A.; Mari, F.; Daga, S.; Meloni, I.; Bruttini, M.; Croci, S.; Lista, M.; Maffeo, D.; Pasquinelli, E.; Brunelli, G.; Zguro, K.; Serio, V. B.; Antolini, E.; Basso, S. L.; Minetto, S.; Rollo, G.; Rozza, M.; Rina, A.; Tita, R.; Mencarelli, M. A.; Rizzo, C. L.; Pinto, A. M.; Ariani, F.; Montagnani, F.; Tumbarello, M.; Rancan, I.; Fabbiani, M.; Bianchi, F.; Picchiotti, N.; Bargagli, E.; Bergantini, L.; D'Alessandro, M.; Cameli, P.; Bennett, D.; Anedda, F.; Marcantonio, S.; Scolletta, S.; Franchi, F.; Mazzei, M. A.; Guerrini, S.; Conticini, E.; Cantarini, L.; Frediani, B.; Tacconi, D.; Raffaelli, C. S.; Emiliozzi, A.; Feri, M.; Donati, A.; Scala, R.; Guidelli, L.; Spargi, G.; Corridi, M.; Nencioni, C.; Croci, L.; Caldarelli, G. P.; Romani, D.; Piacentini, P.; Bandini, M.; Desanctis, E.; Cappelli, S.; Canaccini, A.; Verzuri, A.; Anemoli, V.; Pisani, M.; Ognibene, A.; Lorubbio, M.; Pancrazzi, A.; Vaghi, M.; Monforte, A. D.; Miraglia, F. G.; Mondelli, M. U.; Mantovani, S.; Bruno, R.; Vecchia, M.; Maffezzoni, M.; Martinelli, E.; Girardis, M.; Busani, S.; Venturelli, S.; Cossarizza, A.; Antinori, A.; Vergori, A.; Rusconi, S.; Siano, M.; Gabrieli, A.; Riva, A.; Francisci, D.; Schiaroli, E.; Pallotto, C.; Parisi, S. G.; Basso, M.; Panese, S.; Baratti, S.; Scotton, P. G.; Andretta, F.; Giobbia, M.; Scaggiante, R.; Gatti, F.; Castelli, F.; Quiros-Roldan, E.; Antoni, M. D.; Zanella, I.; della Monica, M.; Piscopo, C.; Capasso, M.; Russo, R.; Andolfo, I.; Iolascon, A.; Merla, G.; Fiorentino, G.; Carella, M.; Castori, M.; Squeo, G. M.; Aucella, F.; Raggi, P.; Perna, R.; Bassetti, M.; Di Biagio, A.; Sanguinetti, M.; Masucci, L.; Guarnaccia, A.; Valente, S.; Di Florio, A.; Mandala, M.; Giorli, A.; Salerni, L.; Zucchi, P.; Parravicini, P.; Menatti, E.; Trotta, T.; Giannattasio, F.; Coiro, G.; Lena, F.; Lacerenza, G.; Mussini, C.; Tavecchia, L.; Crotti, L.; Parati, G.; Mene, R.; Sanarico, M.; Gori, M.; Raimondi, F.; Stella, A.; Biscarini, F.; Milano, ; Bachetti, T.; La Rovere, M. T.; Bussotti, M.; Ludovisi, S.; Capitani, K.; Dei, S.; Ravaglia, S.; Giliberti, A.; Gori, G.; Artuso, R.; Andreucci, E.; Pagliazzi, A.; Fiorentini, E.; Perrella, A.; Bergomi, P.; Catena, E.; Colombo, R.; Luchi, S.; Morelli, G.; Petrocelli, P.; Iacopini, S.; Modica, S.; Baroni, S.; Micheli, G.; Falcone, M.; Urso, D.; Tiseo, G.; Matucci, T.; Grassi, D.; Ferri, C.; Marinangeli, F.; Brancati, F.; Vincenti, A.; Borgo, V.; Lombardi, S.; Lenzi, M.; Di Pietro, M. A.; Vichi, F.; Romanin, B.; Attala, L.; Costa, C.; Gabbuti, A.; Bellucci, A.; Casprini, P.; Pomara, C.; Esposito, M.; Leoncini, R.; Cirianni, M.; Galasso, L.; Bellini, M. A.; Gabbi, C.. - In: FRONTIERS IN GENETICS. - ISSN 1664-8021. - 15:(2024), pp. 1-19. [10.3389/fgene.2024.1362469]
Martelloni, G.; Turchi, A.; Fallerini, C.; Degl'Innocenti, A.; Baldassarri, M.; Olmi, S.; Furini, S.; Renieri, A.; Mari, F.; Daga, S.; Meloni, I.; Bru...espandi
File in questo prodotto:
File Dimensione Formato  
MartelloniFrontGenet2024.pdf

Open access

Tipologia: Versione pubblicata dall'editore
Dimensione 2.54 MB
Formato Adobe PDF
2.54 MB Adobe PDF Visualizza/Apri
Pubblicazioni consigliate

Licenza Creative Commons
I metadati presenti in IRIS UNIMORE sono rilasciati con licenza Creative Commons CC0 1.0 Universal, mentre i file delle pubblicazioni sono rilasciati con licenza Attribuzione 4.0 Internazionale (CC BY 4.0), salvo diversa indicazione.
In caso di violazione di copyright, contattare Supporto Iris

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11380/1350289
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus 0
  • ???jsp.display-item.citation.isi??? ND
social impact