Analisi di dati di DNA microarray: reti di regolazione

Bellazzi, R.; Bicciato, Silvio; Cobelli, C.; Di Camillo, B.; Ferrazzi, F.; Magni, P.; Sacchi, L.; Toffolo, G.

I processi cellulari coinvolgono milioni di molecole che svolgono un ruolo coerente al fine di scambiare materia, energia e informazione con l’ambiente. Questi processi vengono regolati dai geni, la cui espressione è a loro volta regolata da una rete di interazioni fra altri geni, proteine e piccole molecole, detta rete di regolazione genica. Le reti di regolazione riguardano una svariata serie di segnali sia intracellulari, come le concentrazioni di mRNA, sia intercellulari, come gli ormoni, sia extracellulari, quali le variazioni delle condizioni ambientali (come gli stress termici). In maggior dettaglio, i geni vengono tradotti in proteine tramite un sistema di trascrizione (da DNA a mRNA) e traduzione (da mRNA a proteine) che è controllato da vari meccanismi (Nelson e Cox, 2002, Kohane et al., 2003). La trascrizione ha inizio in una particolare regione del DNA nota come regione del promotore, che è solitamente caratterizzata dalla presenza di segnali di riconoscimento per fattori di trascrizione, come la "TATA box" (TATAAA), "GC box", o "CAAT box" (CCAAT). Alla TATA box si lega una proteina, detta TBP (“TATA-binding” protein”), che, insieme ad altre proteine, consente all’enzima che permette la trascrizione, la RNA-polimerasi, di posizionarsi correttamente e venire attivata per iniziare la sintesi di RNA. I meccanismi di regolazione della trascrizione coinvolgono una serie di proteine, dette fattori di trascrizione, che possono bloccare il legame al promotore, o viceversa aumentare la probabilità che la RNA-polimerasi vi si leghi. In aggiunta a questi meccanismi, vi sono altri meccanismi di controllo che possono dar luogo, ad esempio, a splicing alternativi e modifiche post-trascrizionali. Tutti questi meccanismi influenzano la traduzione del messaggero in proteine. Per altro, proteine diverse possono essere formate a seguito dell’attivazione di un medesimo gene anche per effetto di modifiche post-traduzionali, anch’esse governate dalla presenza di proteine specifiche. La concentrazione di ogni proteina inoltre, è fortemente dipendente dalla presenza di altre molecole sia all’interno sia al di fuori della cellula, come i metaboliti o altre proteine; il ruolo svolto da queste molecole dipende da un complesso sistema noto come “signalling network”, che comprende recettori di membrana, proteine di “segnalazione” intra e intercellulari e i destinatari dei messaggi, ad esempio enzimi, altre proteine o complessi proteici (Roberts et al., 2000). E’ evidente quindi come lo studio delle reti di regolazione genica richieda di tener conto di aspetti genomici, proteomici e di regolazione metabolica. Non è perciò difficile apprezzare l’enorme complessità che queste reti possono raggiungere né la difficoltà di una loro modellizzazione matematica. La disponibilità dei DNA microarrays ha reso oggi possibile effettuare delle misure di espressione a livello dell’intero genoma e, grazie ai dati raccolti nel tempo, di osservarne la dinamica in diversi contesti sperimentali (Kohane et al., 2003). Grazie a queste osservazioni, è possibile inferire delle relazioni temporali fra le espressioni dei geni e, quindi, formulare delle ipotesi sulla struttura delle reti di regolazione. Questa attività è chiamata “reverse-engineering”, in quanto affronta il problema inverso di formulare delle ipotesi sul sistema dinamico che ha generato i dati sulla base dell’osservazione dei dati stessi (de Jong, 2002, Brazhnik et al., 2002).Nel corso degli ultimi anni sono stati proposti molti metodi per la generazione di reti di regolazione sulla base di dati di DNA microarrays (de Jong, 2002). Gli “ingredienti” della maggior parte di questi metodi sono una rete di interazioni, che esprime quali sono i legami fra i geni, ed un modello delle interazioni, in grado di descrivere la dinamica del sistema. Una rete di interazioni tra geni viene solitamente rappresentata tramite un grafo. Un grafo è definito come una tupla <N,E>, in cui N è un insieme di nodi (o vertici) ed E è un insieme di archi. A sua volta un arco è una tupla di nodi <i,j>, che esprime la presenza di una connessione fra i nodi stessi. Il modello della dinamica varia molto a seconda della metodologia scelta; sono state infatti proposte diverse soluzioni, che comprendono sistemi di equazioni differenziali ed alle differenze, modelli stocastici e modelli qualitativi. Alcuni approcci proposti in letteratura si occupano soltanto dell’apprendimento del grafo. Ad esempio, le Relevance Networks (RN) (Butte, 2000) generano un grafo a partire dalla misura di espressione dei geni in diverse condizioni sperimentali (ad es. istanti di tempo successivi). Sulla base di queste misure è possibile calcolare l’indice di correlazione di Pearson di ciascuna coppia di geni. Si ricava quindi un grafo non orientato in cui due geni sono connessi se il modulo del loro indice di correlazione supera un’opportuna soglia.In questo contributo, viceversa, verranno descritte alcune fra le metodologie più avanzate per l’apprendimento automatico sia della struttura delle reti di regolazione sia della loro dinamica: le reti Booleane, le reti Bayesiane e le reti basate su equazioni differenziali.La conoscenza di queste metodologie è un pre-requisito per la comprensione di strategie più complesse recentemente proposte in letteratura (Segal et al, 2001). Inoltre, questi metodi sono interessanti non solo nel campo delle reti di regolazione genica, ma anche in tutti i contesti in cui sia possibile modellizzare sistemi complessi mediante una rete di interazioni fra elementi semplici.

Analisi di dati di DNA microarray: reti di regolazione / Bellazzi, R.; Bicciato, Silvio; Cobelli, C.; Di Camillo, B.; Ferrazzi, F.; Magni, P.; Sacchi, L.; Toffolo, G.. - STAMPA. - (2004), pp. 413-429.

Analisi di dati di DNA microarray: reti di regolazione

BELLAZZI R.;BICCIATO, Silvio;COBELLI C.;DI CAMILLO B.;FERRAZZI F.;MAGNI P.;SACCHI L.;TOFFOLO G.

2004

Abstract

I processi cellulari coinvolgono milioni di molecole che svolgono un ruolo coerente al fine di scambiare materia, energia e informazione con l’ambiente. Questi processi vengono regolati dai geni, la cui espressione è a loro volta regolata da una rete di interazioni fra altri geni, proteine e piccole molecole, detta rete di regolazione genica. Le reti di regolazione riguardano una svariata serie di segnali sia intracellulari, come le concentrazioni di mRNA, sia intercellulari, come gli ormoni, sia extracellulari, quali le variazioni delle condizioni ambientali (come gli stress termici). In maggior dettaglio, i geni vengono tradotti in proteine tramite un sistema di trascrizione (da DNA a mRNA) e traduzione (da mRNA a proteine) che è controllato da vari meccanismi (Nelson e Cox, 2002, Kohane et al., 2003). La trascrizione ha inizio in una particolare regione del DNA nota come regione del promotore, che è solitamente caratterizzata dalla presenza di segnali di riconoscimento per fattori di trascrizione, come la "TATA box" (TATAAA), "GC box", o "CAAT box" (CCAAT). Alla TATA box si lega una proteina, detta TBP (“TATA-binding” protein”), che, insieme ad altre proteine, consente all’enzima che permette la trascrizione, la RNA-polimerasi, di posizionarsi correttamente e venire attivata per iniziare la sintesi di RNA. I meccanismi di regolazione della trascrizione coinvolgono una serie di proteine, dette fattori di trascrizione, che possono bloccare il legame al promotore, o viceversa aumentare la probabilità che la RNA-polimerasi vi si leghi. In aggiunta a questi meccanismi, vi sono altri meccanismi di controllo che possono dar luogo, ad esempio, a splicing alternativi e modifiche post-trascrizionali. Tutti questi meccanismi influenzano la traduzione del messaggero in proteine. Per altro, proteine diverse possono essere formate a seguito dell’attivazione di un medesimo gene anche per effetto di modifiche post-traduzionali, anch’esse governate dalla presenza di proteine specifiche. La concentrazione di ogni proteina inoltre, è fortemente dipendente dalla presenza di altre molecole sia all’interno sia al di fuori della cellula, come i metaboliti o altre proteine; il ruolo svolto da queste molecole dipende da un complesso sistema noto come “signalling network”, che comprende recettori di membrana, proteine di “segnalazione” intra e intercellulari e i destinatari dei messaggi, ad esempio enzimi, altre proteine o complessi proteici (Roberts et al., 2000). E’ evidente quindi come lo studio delle reti di regolazione genica richieda di tener conto di aspetti genomici, proteomici e di regolazione metabolica. Non è perciò difficile apprezzare l’enorme complessità che queste reti possono raggiungere né la difficoltà di una loro modellizzazione matematica. La disponibilità dei DNA microarrays ha reso oggi possibile effettuare delle misure di espressione a livello dell’intero genoma e, grazie ai dati raccolti nel tempo, di osservarne la dinamica in diversi contesti sperimentali (Kohane et al., 2003). Grazie a queste osservazioni, è possibile inferire delle relazioni temporali fra le espressioni dei geni e, quindi, formulare delle ipotesi sulla struttura delle reti di regolazione. Questa attività è chiamata “reverse-engineering”, in quanto affronta il problema inverso di formulare delle ipotesi sul sistema dinamico che ha generato i dati sulla base dell’osservazione dei dati stessi (de Jong, 2002, Brazhnik et al., 2002).Nel corso degli ultimi anni sono stati proposti molti metodi per la generazione di reti di regolazione sulla base di dati di DNA microarrays (de Jong, 2002). Gli “ingredienti” della maggior parte di questi metodi sono una rete di interazioni, che esprime quali sono i legami fra i geni, ed un modello delle interazioni, in grado di descrivere la dinamica del sistema. Una rete di interazioni tra geni viene solitamente rappresentata tramite un grafo. Un grafo è definito come una tupla , in cui N è un insieme di nodi (o vertici) ed E è un insieme di archi. A sua volta un arco è una tupla di nodi , che esprime la presenza di una connessione fra i nodi stessi. Il modello della dinamica varia molto a seconda della metodologia scelta; sono state infatti proposte diverse soluzioni, che comprendono sistemi di equazioni differenziali ed alle differenze, modelli stocastici e modelli qualitativi. Alcuni approcci proposti in letteratura si occupano soltanto dell’apprendimento del grafo. Ad esempio, le Relevance Networks (RN) (Butte, 2000) generano un grafo a partire dalla misura di espressione dei geni in diverse condizioni sperimentali (ad es. istanti di tempo successivi). Sulla base di queste misure è possibile calcolare l’indice di correlazione di Pearson di ciascuna coppia di geni. Si ricava quindi un grafo non orientato in cui due geni sono connessi se il modulo del loro indice di correlazione supera un’opportuna soglia.In questo contributo, viceversa, verranno descritte alcune fra le metodologie più avanzate per l’apprendimento automatico sia della struttura delle reti di regolazione sia della loro dinamica: le reti Booleane, le reti Bayesiane e le reti basate su equazioni differenziali.La conoscenza di queste metodologie è un pre-requisito per la comprensione di strategie più complesse recentemente proposte in letteratura (Segal et al, 2001). Inoltre, questi metodi sono interessanti non solo nel campo delle reti di regolazione genica, ma anche in tutti i contesti in cui sia possibile modellizzare sistemi complessi mediante una rete di interazioni fra elementi semplici.

Scheda breve

Scheda completa

Scheda completa (DC)

	Anno di pubblicazione
	
				2004
			
	Titolo del Volume
	
				Metodi avanzati di elaborazione di segnali biomedici
			
	Codice ISBN del Volume
	
				9788855527682
			
	Nome Editore
	
				Patron
			
	Paese Editore
	
				ITALIA
			
	Citazione
	
				Analisi di dati di DNA microarray: reti di regolazione / Bellazzi, R.; Bicciato, Silvio; Cobelli, C.; Di Camillo, B.; Ferrazzi, F.; Magni, P.; Sacchi, L.; Toffolo, G.. - STAMPA. - (2004), pp. 413-429.
			
	Tutti gli autori
	
						Bellazzi, R.; Bicciato, Silvio; Cobelli, C.; Di Camillo, B.; Ferrazzi, F.; Magni, P.; Sacchi, L.; Toffolo, G.
					
	Tipologia
	
				Capitolo/Saggio

File in questo prodotto:

Non ci sono file associati a questo prodotto.

Pubblicazioni consigliate

I metadati presenti in IRIS UNIMORE sono rilasciati con licenza Creative Commons CC0 1.0 Universal, mentre i file delle pubblicazioni sono rilasciati con licenza Attribuzione 4.0 Internazionale (CC BY 4.0), salvo diversa indicazione.
In caso di violazione di copyright, contattare Supporto Iris

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11380/421202

Analisi di dati di DNA microarray: reti di regolazione

BELLAZZI R.;BICCIATO, Silvio;COBELLI C.;DI CAMILLO B.;FERRAZZI F.;MAGNI P.;SACCHI L.;TOFFOLO G.

2004

Abstract

Scheda breve

Scheda completa

Scheda completa (DC)

Pubblicazioni consigliate

Citazioni

social impact

Analisi di dati di DNA microarray: reti di regolazione

BELLAZZI R.;BICCIATO, Silvio;COBELLI C.;DI CAMILLO B.;FERRAZZI F.;MAGNI P.;SACCHI L.;TOFFOLO G.

2004

Abstract

Scheda breve Scheda completa Scheda completa (DC)

Pubblicazioni consigliate

Informazioni

Citazioni

social impact

Conferma cancellazione

Scheda breve

Scheda completa

Scheda completa (DC)