banner

Notizia

Nov 03, 2023

Il metodo di apprendimento automatico sviluppato dai ricercatori della CMU illumina gli aspetti fondamentali dell'evoluzione

Un team di ricercatori del Dipartimento di Biologia Computazionale della Carnegie Mellon University (si apre in una nuova finestra) (CBD) ha sviluppato nuovi metodi per identificare parti del genoma fondamentali per comprendere come si sono evoluti alcuni tratti delle specie.

Il lavoro, pubblicato su Science(si apre in una nuova finestra) e condotto dal professore assistente della Scuola di Informatica Andreas Pfenning(si apre in una nuova finestra), contribuisce al progetto Zoonomia(si apre in una nuova finestra), uno sforzo per sequenziare l'intero genoma di 240 mammiferi per far luce su aspetti fondamentali di geni e tratti con importanti implicazioni per la protezione della salute umana e la conservazione della biodiversità. Per dare un senso a questi nuovi e grandi set di dati è necessario disporre delle più recenti tecnologie di intelligenza artificiale (AI) e machine learning (ML).

Alcune parti del genoma conosciute come DNA codificante forniscono istruzioni per la produzione di proteine, i regolatori indispensabili della funzione cellulare. Nel corso del tempo emergono lievi differenze nelle istruzioni che la codifica del DNA fornisce per la produzione delle proteine, diventando una delle forze trainanti dell'evoluzione.

Eppure questi frammenti di DNA che producono proteine ​​rappresentano solo l’1% dei tre miliardi di coppie di nucleotidi che compongono il genoma umano. Altre regioni del DNA non codificanti, note come potenziatori, determinano quando e dove sono attivi geni specifici. Il team della CMU ha creato un approccio ML chiamato Tissue-Aware Conservation Inference Toolkit (TACIT) per saperne di più su come funzionano queste aree. Mentre un modello tradizionale di evoluzione potrebbe dimostrare cambiamenti nelle dimensioni del cervello di una specie attraverso una serie di mutazioni in un gruppo di geni, i potenziatori potrebbero semplicemente attivare o disattivare i geni e ottenere lo stesso risultato.

La maggior parte delle ricerche sull’evoluzione dei mammiferi si concentra sulle parti del genoma che sono cambiate relativamente poco nel corso di milioni di anni. Queste regioni conservate, in particolare i geni, forniscono informazioni sugli elementi fondamentali del DNA dei mammiferi che evidenziano tratti unici nelle singole specie.

La sfida per Pfenning e il suo team è che, nel tempo, le regioni potenziatrici del DNA possono cambiare in sequenza ma non in funzione. Ad esempio, un potenziatore delle isole ben studiato regola i livelli genetici in modelli simili negli esseri umani, nei topi, nei pesci zebra e nelle spugne, nonostante oltre 700 milioni di anni di evoluzione. Ciò li rende molto più difficili da identificare e monitorare utilizzando i metodi tradizionali di esame dei singoli nucleotidi.

TACIT affronta questo problema prevedendo con precisione se un potenziatore sarà attivo in un particolare tipo di cellula o tessuto. Permette agli scienziati di identificare queste importanti regioni potenziatrici in un genoma appena sequenziato senza condurre un nuovo esperimento di laboratorio, offrendo potenziali applicazioni nella biologia della conservazione. Il toolkit può fare previsioni su come funzionano gli stimolatori nelle specie in via di estinzione o minacciate, dove gli esperimenti di laboratorio controllati sono impossibili.

"TACIT fornisce un'opportunità senza precedenti per prevedere la funzione di parti del genoma al di fuori dei geni in specie per le quali non possiamo ottenere campioni di tessuto primario, come il delfino tursiope e il rinoceronte nero in grave pericolo di estinzione", ha affermato Irene Kaplow, autrice principale dello studio. l'articolo e un associato post-dottorato e Lane Fellow in CBD. "Con il miglioramento dei metodi ML e dei metodi per identificare i potenziatori di specifici tipi di cellule, prevedo che saremo in grado di ampliare le funzioni di TACIT per fornire nuovi tipi di informazioni sull'evoluzione dei mammiferi."

Dopo aver previsto la funzione delle sequenze genomiche nei 240 mammiferi, il gruppo di ricerca ha applicato TACIT per identificare le parti del genoma che si sono evolute nei mammiferi per ottenere cervelli più grandi e ha scoperto che quelle tendevano ad essere vicine a geni le cui mutazioni sono state implicate nel cervello umano. disturbi dimensionali. Hanno inoltre identificato un potenziatore associato al comportamento sociale nei mammiferi che è specifico per un particolare sottotipo di neurone, l'interneurone inibitorio positivo alla parvalbumina.

CONDIVIDERE