Il codice genetico e le sue proprietà sono la storia della scoperta. Codice genetico come modo per registrare informazioni ereditarie

La serie di articoli che descrivono le origini del Codice civile può essere considerata come un'indagine su eventi di cui abbiamo lasciato molte tracce. Tuttavia, comprendere questi articoli richiede un certo sforzo per comprendere i meccanismi molecolari della sintesi proteica. Questo articolo è quello introduttivo a una serie di autopubblicazioni dedicate all'origine del codice genetico ed è il posto migliore per iniziare a familiarizzare con questo argomento.
Generalmente codice genetico(GC) è definito come un metodo (regola) per codificare una proteina sulla struttura primaria del DNA o dell'RNA. In letteratura, molto spesso è scritto che si tratta di una corrispondenza unica di una sequenza di tre nucleotidi in un gene con un amminoacido in una proteina sintetizzata o il punto finale della sintesi proteica. Tuttavia, ci sono due errori in questa definizione. Si tratta dei 20 cosiddetti aminoacidi canonici, che fanno parte delle proteine ​​di tutti gli organismi viventi, senza eccezioni. Questi amminoacidi sono monomeri proteici. Gli errori sono i seguenti:

1) Non esistono 20 amminoacidi canonici, ma solo 19. Possiamo chiamare amminoacido una sostanza che contiene contemporaneamente un gruppo amminico -NH 2 e un gruppo carbossilico - COOH. Il fatto è che il monomero proteico - la prolina - non è un amminoacido, poiché contiene un gruppo amminico invece di un gruppo amminico, quindi è più corretto chiamare la prolina un imminoacido. Tuttavia, in futuro, in tutti gli articoli dedicati all'HA, per comodità, scriverò circa 20 aminoacidi, implicando la sfumatura specificata. Le strutture degli amminoacidi sono mostrate in Fig. 1.

Riso. 1. Strutture degli amminoacidi canonici. Gli amminoacidi hanno parti costanti, indicate in nero nella figura, e parti variabili (o radicali), indicate in rosso.

2) La corrispondenza degli amminoacidi ai codoni non è sempre univoca. Per la violazione dei casi di univocità, vedere sotto.

L'emergere di GC significa l'emergere della sintesi proteica codificata. Questo evento è uno degli eventi chiave per la formazione evolutiva dei primi organismi viventi.

La struttura dell'HA è presentata in forma circolare in Fig. 2.



Riso. 2. Codice genetico a forma circolare. Il cerchio interno è la prima lettera del codone, la seconda cerchio - la seconda lettera del codone, il terzo cerchio - la terza lettera del codone, il quarto cerchio - la designazione degli amminoacidi in un'abbreviazione di tre lettere; P - amminoacidi polari, NP - amminoacidi non polari. Per chiarezza della simmetria, l'ordine scelto dei simboli è importante U-C-A-G.

Cominciamo quindi a descrivere le principali proprietà dell'HA.

1. Triplicità. Ogni amminoacido è codificato da una sequenza di tre nucleotidi.

2. Presenza di segni di punteggiatura intergenici. I segni di punteggiatura intergenici includono sequenze di acidi nucleici in cui inizia o termina la traduzione.

La traduzione non può iniziare da nessun codone, ma solo da uno strettamente definito - di partenza. Il codone di inizio comprende la tripletta AUG, da cui inizia la traduzione. In questo caso, questa tripletta codifica per la metionina o per un altro amminoacido - formilmetionina (nei procarioti), che può essere incluso solo all'inizio della sintesi proteica. Alla fine di ciascun gene che codifica per un polipeptide ce n'è almeno uno dei 3 codoni di arresto, O luci dei freni: UAA, UAG, UGA. Terminano la traduzione (la cosiddetta sintesi proteica sul ribosoma).

3. Compattezza o assenza di segni di punteggiatura intragenici. All'interno di un gene, ciascun nucleotide fa parte di un codone significativo.

4. Non sovrapponibile. I codoni non si sovrappongono tra loro; ciascuno ha il proprio insieme ordinato di nucleotidi, che non si sovrappone con insiemi simili di codoni vicini.

5. Degenerazione. La corrispondenza inversa nella direzione amminoacido-codone è ambigua. Questa proprietà è chiamata degenerazione. Serieè un insieme di codoni che codificano per un amminoacido, in altre parole è un gruppo codoni equivalenti. Pensiamo a un codone come XYZ. Se XY specifica il "senso" (cioè un amminoacido), viene chiamato il codone forte. Se per determinare il significato di un codone è necessaria una certa Z, viene chiamato tale codone Debole.

La degenerazione del codice è strettamente correlata all'ambiguità dell'accoppiamento codone-anticodone (un anticodone significa una sequenza di tre nucleotidi sul tRNA, che può accoppiarsi in modo complementare con un codone sull'RNA messaggero (vedi due articoli per maggiori dettagli su questo: Meccanismi molecolari per garantire la degenerazione del codice E La regola di Lagerquist. Giustificazione fisico-chimica delle simmetrie e delle relazioni di Rumer). Un anticodone su un tRNA può riconoscere da uno a tre codoni su un mRNA.

6.Inequivocabilità. Ciascuna tripletta codifica per un solo amminoacido o è un terminatore della traduzione.

Ci sono tre eccezioni conosciute.

Primo. Nei procarioti, codifica in prima posizione (lettera maiuscola) la formilmetionina e in qualsiasi altra posizione la metionina. All'inizio del gene, la formilmetionina è codificata sia dal solito codone della metionina AUG che anche dal codone della valina GUG o della leucina UUG , che all'interno del gene codificano rispettivamente per valina e leucina .

In molte proteine, la formilmetionina viene scissa o il gruppo formile viene rimosso, con il risultato che la formilmetionina viene convertita in metionina normale.

Secondo. Nel 1986, diversi gruppi di ricercatori scoprirono che il codone di stop UGA sull'mRNA può codificare la selenocisteina (vedi Fig. 3), a condizione che sia seguito da una speciale sequenza nucleotidica.

Riso. 3. Struttura del 21° amminoacido: selenocisteina.

U Escherichia coli(questo è il nome latino dell'Escherichia coli) il selenocisteil-tRNA durante la traduzione riconosce il codone UGA nell'mRNA, ma solo in un determinato contesto: affinché il codone UGA venga riconosciuto come significativo, è necessaria una sequenza di 45 nucleotidi di lunghezza situata dopo l'UGA il codone è importante.

L'esempio considerato mostra che, se necessario, un organismo vivente può modificare il significato del codice genetico standard. In questo caso, l'informazione genetica contenuta nei geni è codificata in modo più complesso. Il significato di un codone è determinato nel contesto di una specifica sequenza nucleotidica estesa e con la partecipazione di diversi fattori proteici altamente specifici. È importante che il tRNA della selenocisteina sia stato trovato in rappresentanti di tutti e tre i rami della vita (archaea, eubatteri ed eucarioti), il che indica l'antica origine della sintesi della selenocisteina e la sua possibile presenza nell'ultimo antenato comune universale (che sarà se ne parlerà in altri articoli). Molto probabilmente, la selenocisteina si trova in tutti gli organismi viventi senza eccezioni. Ma in qualsiasi organismo, la selenocisteina si trova in non più di dozzine di proteine. Fa parte dei centri attivi degli enzimi, in una serie di omologhi di cui la cisteina ordinaria può funzionare in una posizione simile.

Fino a poco tempo fa si credeva che il codone UGA potesse essere letto sia come selenocisteina che come terminale, ma recentemente è stato dimostrato che nei ciliati Euplotes Il codone UGA codifica la cisteina o la selenocisteina. Cm. " Codice genetico ammette discrepanze"

Terza eccezione. Alcuni procarioti (5 specie di archaea e un eubatterio - le informazioni su Wikipedia sono molto obsolete) contengono un acido speciale: la pirrolisina (Fig. 4). È codificato dalla tripletta UAG, che nel codice canonico funge da terminatore di traduzione. Si presume che in questo caso, analogamente al caso della codifica della selenocisteina, la lettura dell'UAG come codone della pirrolisina avvenga a causa di una struttura speciale sull'mRNA. Il tRNA della pirrolisina contiene l'anticodone CTA ed è aminoacilato dalle ARSasi di classe 2 (per la classificazione delle ARSasi si veda l'articolo “Le codificazioni aiutano a comprendere come codice genetico ").

UAG è usato raramente come codone di stop e, quando viene utilizzato, è spesso seguito da un altro codone di stop.

Riso. 4. Struttura del 22esimo amminoacido della pirrolisina.

7. Versatilità. Dopo che la decifrazione del codice civile fu completata a metà degli anni '60 del secolo scorso, per molto tempo si credette che il codice fosse lo stesso in tutti gli organismi, il che indica l'unità di origine di tutta la vita sulla Terra.

Cerchiamo di capire perché il Codice civile è universale. Il fatto è che se almeno una regola di codifica dovesse cambiare nel corpo, ciò porterebbe a un cambiamento nella struttura di una parte significativa delle proteine. Un simile cambiamento sarebbe troppo drastico e quindi quasi sempre letale, poiché un cambiamento nel significato di un solo codone può influenzare in media 1/64 di tutte le sequenze di aminoacidi.

Ciò porta a un’idea molto importante: il GC non è praticamente cambiato dalla sua formazione, avvenuta più di 3,5 miliardi di anni fa. Ciò significa che la sua struttura porta traccia della sua origine, e l'analisi di questa struttura può aiutare a capire esattamente come potrebbe essersi formato il GC.

In effetti, l'HA può differire leggermente nei batteri, nei mitocondri, nel codice nucleare di alcuni ciliati e nel lievito. Attualmente esistono almeno 17 codici genetici che differiscono da quello canonico di 1-5 codoni. In totale, in tutte le varianti conosciute di deviazioni dal GK universale, vengono utilizzate 18 diverse sostituzioni del significato di un codone. La maggior parte delle deviazioni dal codice standard sono note per i mitocondri - 10. È interessante notare che i mitocondri di vertebrati, vermi piatti ed echinodermi sono codificati da codici diversi, mentre funghi, protozoi e celenterati sono codificati da uno.

La vicinanza evolutiva delle specie non garantisce affatto che abbiano CV simili. I codici genetici possono variare anche tra diverse specie di micoplasmi (alcune specie hanno un codice canonico, mentre altre ne hanno uno divergente). Una situazione simile si osserva per il lievito.

È importante notare che i mitocondri discendono da organismi simbiotici che si sono adattati a vivere all’interno delle cellule. Hanno un genoma notevolmente ridotto; alcuni geni si sono spostati nel nucleo della cellula. Pertanto, i cambiamenti nell'HA non sono più così drammatici.

Le eccezioni scoperte successivamente sono di particolare interesse dal punto di vista evolutivo, poiché possono aiutare a far luce sui meccanismi di evoluzione del codice.

Tabella 1.

Codici mitocondriali in vari organismi.

Codone

Codice universale

Codici mitocondriali

Vertebrati

Invertebrati

Lievito

Impianti

U.G.A.

FERMARE

Trp

Trp

Trp

FERMARE

AUA

Ile

Incontrato

Incontrato

Incontrato

Ile

CUA

Leu

Leu

Leu

Thr

Leu

A.G.A.

Arg

FERMARE

Ser

Arg

Arg

AGG

Arg

FERMARE

Ser

Arg

Arg

Tre meccanismi per cambiare l'amminoacido codificato dal codice.

Il primo è quando un certo codone non viene utilizzato (o quasi non utilizzato) da qualche organismo a causa della presenza irregolare di alcuni nucleotidi (composizione GC) o combinazioni di nucleotidi. Di conseguenza, un tale codone può scomparire completamente dall'uso (ad esempio, a causa della perdita del tRNA corrispondente) e può successivamente essere utilizzato per codificare un altro amminoacido senza causare danni significativi all'organismo. Questo meccanismo potrebbe essere responsabile dell'emergere di alcuni dialetti codificati nei mitocondri.

La seconda è la trasformazione del codone di stop nel senso di ovuli. In questo caso, alcune delle proteine ​​tradotte potrebbero avere aggiunte. Tuttavia, la situazione è parzialmente salvata dal fatto che molti geni spesso terminano non con uno, ma con due codoni di stop, poiché sono possibili errori di traduzione, in cui i codoni di stop vengono letti come amminoacidi.

Il terzo è la possibile lettura ambigua di alcuni codoni, come nel caso di alcuni funghi.

8 . Connettività. Vengono chiamati i gruppi di codoni equivalenti (cioè i codoni che codificano per lo stesso amminoacido). in serie. GC contiene 21 serie, inclusi i codoni di stop. Nel seguito, per chiarezza, verrà chiamato qualsiasi gruppo di codoni collegamento, se da ciascun codone di questo gruppo si può passare a tutti gli altri codoni dello stesso gruppo mediante successive sostituzioni nucleotidiche. Delle 21 serie, 18 sono collegate. 2 serie contengono un codone ciascuna e solo 1 serie per l'amminoacido serina non è collegata e si divide in due sottoserie collegate.


Riso. 5. Grafici di connettività per alcune serie di codici. a - serie collegate di valina; b - serie collegate di leucina; La serie serina è incoerente e si divide in due sottoserie collegate. La figura è tratta dall'articolo di V.A. Ratner" Codice genetico come un sistema."

La proprietà di connettività può essere spiegata dal fatto che durante il periodo di formazione il GC ha catturato nuovi codoni, che erano minimamente diversi da quelli già utilizzati.

9. Regolarità proprietà degli amminoacidi basati sulle radici di triplette. Tutti gli amminoacidi codificati dalle triplette della radice U sono non polari, non hanno proprietà e dimensioni estreme e hanno radicali alifatici. Tutte le triplette con radice C hanno basi forti e gli amminoacidi che codificano sono di dimensioni relativamente piccole. Tutte le triplette con radice A hanno basi deboli e codificano amminoacidi polari di non piccole dimensioni. I codoni con radice G sono caratterizzati da varianti estreme e anomale di amminoacidi e serie. Codificano l'amminoacido più piccolo (glicina), il più lungo e piatto (triptofano), il più lungo e nodoso (arginina), il più reattivo (cisteina) e formano una sottoserie anomala della serina.

10. Blocco. Il Codice Civile Universale è un codice “blocco”. Ciò significa che gli amminoacidi con proprietà fisico-chimiche simili sono codificati da codoni che differiscono l'uno dall'altro per una base. La natura a blocchi del codice è chiaramente visibile nella figura seguente.


Riso. 6. Struttura in blocchi del codice civile. Gli amminoacidi con un gruppo alchilico sono indicati in bianco.


Riso. 7. Rappresentazione cromatica delle proprietà fisico-chimiche degli amminoacidi, in base ai valori​​descritti nel libroStiers "Biochimica". A sinistra c’è l’idrofobicità. A destra c'è la capacità di formare un'alfa elica in una proteina. I colori rosso, giallo e blu indicano amminoacidi con idrofobicità alta, media e bassa (a sinistra) o il corrispondente grado di capacità di formare un'alfa elica (a destra).

La proprietà di blocco e regolarità può essere spiegata anche dal fatto che durante il periodo di formazione il GC ha catturato nuovi codoni, che erano minimamente diversi da quelli già utilizzati.

I codoni con le stesse prime basi (prefissi dei codoni) codificano amminoacidi con vie biosintetiche simili. I codoni degli amminoacidi appartenenti alle famiglie shikimato, piruvato, aspartato e glutammato hanno rispettivamente U, G, A e C come prefissi. Sui percorsi dell'antica biosintesi degli amminoacidi e sulla sua connessione con le proprietà del codice moderno, vedere "Antico doppietto codice genetico era predeterminato dalle vie di sintesi degli amminoacidi. "Sulla base di questi dati, alcuni ricercatori concludono che la formazione del codice è stata fortemente influenzata dalle relazioni biosintetiche tra gli amminoacidi. Tuttavia, la somiglianza delle vie biosintetiche non significa affatto la somiglianza delle proprietà fisico-chimiche.

11. Immunità al rumore. Nella forma più generale, l’immunità al rumore dell’HA significa che con mutazioni puntiformi casuali ed errori di traduzione, le proprietà fisico-chimiche degli amminoacidi non cambiano molto.

La sostituzione di un nucleotide in una tripletta nella maggior parte dei casi non porta a un cambiamento nell'amminoacido codificato o porta a un cambiamento in un amminoacido con la stessa polarità.

Uno dei meccanismi che garantiscono l'immunità al rumore di un GC è la sua degenerazione. La degenerazione media è uguale al numero di segnali codificati/numero totale di codoni, dove i segnali codificati includono 20 aminoacidi e il segno di terminazione della traduzione. La degenerazione media per tutti gli amminoacidi e il segno di terminazione è di tre codoni per segnale codificato.

Per quantificare l’immunità al rumore introduciamo due concetti. Vengono chiamate mutazioni di sostituzione nucleotidica che non portano a un cambiamento nella classe dell'amminoacido codificato conservatore. Vengono chiamate mutazioni delle sostituzioni nucleotidiche che portano a un cambiamento nella classe dell'amminoacido codificato radicale .

Ogni tripletta consente 9 sostituzioni singole. Ci sono 61 triplette codificanti aminoacidi in totale, pertanto il numero di possibili sostituzioni nucleotidiche per tutti i codoni è

61 x 9 = 549. Di questi:

23 sostituzioni nucleotidiche danno luogo a codoni di stop.

134 sostituzioni non modificano l'amminoacido codificato.
230 sostituzioni non cambiano la classe dell'amminoacido codificato.
162 sostituzioni portano ad un cambiamento nella classe degli aminoacidi, cioè sono radicali.
Delle 183 sostituzioni del 3° nucleotide, 7 portano alla comparsa di terminatori di traduzione e 176 sono conservative.
Delle 183 sostituzioni del 1° nucleotide, 9 portano alla comparsa di terminatori, 114 sono conservative e 60 radicali.
Delle 183 sostituzioni del 2° nucleotide, 7 portano alla comparsa di terminatori, 74 sono conservative, 102 radicali.

Sulla base di questi calcoli, otteniamo una valutazione quantitativa dell'immunità al rumore del codice come rapporto tra il numero di sostituzioni conservative e il numero di sostituzioni radicali. È pari a 364/162=2,25

Quando si valuta realisticamente il contributo della degenerazione all'immunità al rumore, è necessario tenere conto della frequenza di presenza degli aminoacidi nelle proteine, che varia nelle diverse specie.

Qual è il motivo dell'immunità al rumore del codice? La maggior parte dei ricercatori ritiene che questa proprietà sia una conseguenza della selezione di GC alternativi.

Stephen Freeland e Lawrence Hurst hanno generato tali codici casuali e hanno scoperto che solo un codice alternativo su cento non era meno resistente al rumore del codice universale.
Un fatto ancora più interessante è emerso quando questi ricercatori hanno introdotto un ulteriore vincolo per tenere conto delle tendenze effettive nei modelli di mutazione del DNA e negli errori di traduzione. In tali condizioni, SOLO UN CODICE SU UN MILIONE POSSIBILE si è rivelato migliore del codice canonico.
Questa vitalità senza precedenti del codice genetico può essere facilmente spiegata dal fatto che si è formato a seguito della selezione naturale. Forse un tempo esistevano molti codici nel mondo biologico, ciascuno con la propria sensibilità agli errori. L’organismo che riusciva a far fronte meglio ad essi aveva maggiori possibilità di sopravvivenza, e il codice canonico semplicemente vinse la lotta per l’esistenza. Questa ipotesi sembra abbastanza realistica: dopo tutto, sappiamo che esistono davvero codici alternativi. Per ulteriori informazioni sull'immunità al rumore, vedere Evoluzione codificata (S. Freeland, L. Hirst “Evoluzione codificata”. // Nel mondo della scienza. - 2004, n. 7).

In conclusione, propongo di contare il numero di possibili codici genetici che possono essere generati per i 20 aminoacidi canonici. Per qualche motivo non ho trovato questo numero da nessuna parte. Quindi, abbiamo bisogno che i GC generati contengano 20 aminoacidi e un segnale di stop, codificato da ALMENO UN CODONE.

Numeriamo mentalmente i codoni in un certo ordine. Ragioneremo come segue. Se abbiamo esattamente 21 codoni, allora ogni amminoacido e segnale di stop occuperanno esattamente un codone. In questo caso ci saranno 21 GC possibili!

Se ci sono 22 codoni, allora apparirà un codone extra, che può avere uno qualsiasi dei 21 sensi, e questo codone può essere posizionato in uno qualsiasi dei 22 posti, mentre i restanti codoni hanno esattamente un senso diverso, come nel caso di 21 codoni. Quindi otteniamo il numero di combinazioni 21!x(21x22).

Se ci sono 23 codoni, allora, ragionando in modo simile, otteniamo che 21 codoni hanno esattamente un significato diverso ciascuno (21! opzioni), e due codoni hanno 21 significati diversi ciascuno (21 2 significati con una posizione FISSA di questi codoni). Il numero di posizioni diverse per questi due codoni sarà 23x22. Il numero totale di varianti GC per 23 codoni è 21!x21 2 x23x22

Se ci sono 24 codoni, il numero di GC sarà 21!x21 3 x24x23x22,...

....................................................................................................................

Se ci sono 64 codoni, il numero di GC possibili sarà 21!x21 43 x64!/21! = 21 43x64! ~ 9,1x10 145

Nel metabolismo del corpo ruolo di primo piano appartiene alle proteine ​​e agli acidi nucleici.
Le sostanze proteiche costituiscono la base di tutte le strutture cellulari vitali, hanno una reattività insolitamente elevata e sono dotate di funzioni catalitiche.
Gli acidi nucleici fanno parte dell'organo più importante della cellula: il nucleo, così come il citoplasma, i ribosomi, i mitocondri, ecc. Gli acidi nucleici svolgono un ruolo importante e primario nell'ereditarietà, nella variabilità corporea e nella sintesi proteica.

Piano sintesi le proteine ​​sono immagazzinate nel nucleo della cellula e la sintesi diretta avviene all'esterno del nucleo, quindi è necessaria servizio di consegna codificato piano dal nucleo al sito di sintesi. Questo servizio di consegna viene eseguito da molecole di RNA.

Il processo inizia alle nucleo cellule: parte della “scala” del DNA si srotola e si apre. Grazie a ciò, le lettere dell’RNA formano legami con le lettere del DNA aperte di uno dei filamenti del DNA. L'enzima trasferisce le lettere dell'RNA per unirle in un filamento. È così che le lettere del DNA vengono “riscritte” nelle lettere dell’RNA. La catena di RNA appena formata viene separata e la “scala” del DNA si attorciglia nuovamente. Viene chiamato il processo di lettura delle informazioni dal DNA e di sintesi utilizzando la sua matrice di RNA trascrizione , e l'RNA sintetizzato è chiamato messaggero o mRNA .

Dopo ulteriori modifiche, questo tipo di mRNA codificato è pronto. mRNA esce dal nucleo e va al sito della sintesi proteica, dove vengono decifrate le lettere dell'mRNA. Ogni serie di tre lettere i-RNA forma una “lettera” che rappresenta un amminoacido specifico.

Un altro tipo di RNA trova questo amminoacido, lo cattura con l'aiuto di un enzima e lo consegna al sito di sintesi proteica. Questo RNA è chiamato RNA di trasferimento o t-RNA. Man mano che il messaggio dell'mRNA viene letto e tradotto, la catena di aminoacidi cresce. Questa catena si attorciglia e si piega in una forma unica, creando un tipo di proteina. Anche il processo di ripiegamento delle proteine ​​è notevole: ci vuole un computer per calcolare tutto opzioni per ripiegare una proteina di medie dimensioni composta da 100 aminoacidi occorrerebbero 1027 (!) anni. E non ci vuole più di un secondo per formare una catena di 20 aminoacidi nel corpo, e questo processo avviene continuamente in tutte le cellule del corpo.

Geni, codice genetico e sue proprietà.

Sulla Terra vivono circa 7 miliardi di persone. A parte le 25-30 milioni di coppie di gemelli identici, geneticamente tutte le persone sono diverse : ognuno è unico, ha caratteristiche ereditarie, tratti caratteriali, abilità e temperamento unici.

Queste differenze sono spiegate differenze nei genotipi- insiemi di geni dell'organismo; Ognuno è unico. Le caratteristiche genetiche di un particolare organismo sono incarnate nelle proteine - pertanto, la struttura della proteina di una persona differisce, anche se di poco, dalla proteina di un'altra persona.

Non significa che non esistono due persone che abbiano esattamente le stesse proteine. Le proteine ​​che svolgono le stesse funzioni possono essere identiche o differire solo leggermente l'una dall'altra per uno o due aminoacidi. Ma non esiste sulla Terra di persone (ad eccezione dei gemelli identici) che avrebbero tutte le loro proteine sono gli stessi .

Informazioni sulla struttura primaria delle proteine codificato come una sequenza di nucleotidi in una sezione di una molecola di DNA, gene – un'unità di informazione ereditaria di un organismo. Ogni molecola di DNA contiene molti geni. L'insieme di tutti i geni di un organismo lo costituisce genotipo . Così,

Il gene è un'unità di informazione ereditaria di un organismo, che corrisponde a una sezione separata del DNA

La codifica delle informazioni ereditarie avviene utilizzando codice genetico , che è universale per tutti gli organismi e differisce solo nell'alternanza di nucleotidi che formano geni e codificano proteine ​​di organismi specifici.

Codice genetico è costituito da triplette (triplette) di nucleotidi del DNA, combinati in diverse sequenze (AAT, HCA, ACG, THC, ecc.), ciascuna delle quali codifica uno specifico amminoacido (che verrà incorporato nella catena polipeptidica).

In realtà codice conta sequenza di nucleotidi in una molecola di mRNA , Perché rimuove le informazioni dal DNA (process trascrizioni ) e lo traduce in una sequenza di aminoacidi nelle molecole delle proteine ​​sintetizzate (il processo trasmissioni ).
La composizione dell'mRNA comprende nucleotidi A-C-G-U, le cui triplette sono chiamate codoni : una tripletta su DNA CGT su i-RNA diventerà una tripletta GCA, e una tripletta DNA AAG diventerà una tripletta UUC. Esattamente codoni dell'mRNA il codice genetico si riflette nel record.

Così, codice genetico - un sistema unificato per la registrazione di informazioni ereditarie in molecole di acido nucleico sotto forma di una sequenza di nucleotidi . Il codice genetico si basa sull'utilizzo di un alfabeto formato da sole quattro lettere-nucleotidi, distinte da basi azotate: A, T, G, C.

Proprietà di base del codice genetico:

1. Codice genetico tripletta. Una tripletta (codone) è una sequenza di tre nucleotidi che codificano un amminoacido. Poiché le proteine ​​contengono 20 aminoacidi, è ovvio che ciascuno di essi non può essere codificato da un nucleotide ( Poiché nel DNA ci sono solo quattro tipi di nucleotidi, in questo caso 16 amminoacidi rimangono non codificati). Anche due nucleotidi non sono sufficienti per codificare gli amminoacidi, poiché in questo caso possono essere codificati solo 16 amminoacidi. Ciò significa che il numero più piccolo di nucleotidi che codificano un amminoacido deve essere almeno tre. In questo caso, il numero di possibili triplette nucleotidiche è 43 = 64.

2. Ridondanza (degenerazione) Il codice è una conseguenza della sua natura di tripletta e significa che un amminoacido può essere codificato da diverse triplette (poiché ci sono 20 amminoacidi e 64 triplette), ad eccezione della metionina e del triptofano, che sono codificati da una sola tripletta. Inoltre, alcune triplette svolgono funzioni specifiche: in una molecola di mRNA, le triplette UAA, UAG, UGA sono codoni di stop, cioè fermare-segnali che fermano la sintesi della catena polipeptidica. La tripletta corrispondente alla metionina (AUG), situata all'inizio della catena del DNA, non codifica per un amminoacido, ma svolge la funzione di inizio (eccitazione) della lettura.

3. Inequivocabilità codice - contemporaneamente alla ridondanza, il codice ha la proprietà univocità : ogni codone corrisponde solo uno un certo amminoacido.

4. Collinearità codice, cioè sequenza nucleotidica in un gene esattamente corrisponde alla sequenza degli aminoacidi in una proteina.

5. Codice genetico non sovrapposti e compatti , cioè non contiene “segni di punteggiatura”. Ciò significa che il processo di lettura non ammette la possibilità di sovrapposizione di colonne (triplette), e, a partire da un certo codone, la lettura procede ininterrottamente, terzina dopo terzina, fino a fermare-segnali ( codoni di arresto).

6. Codice genetico universale , cioè, i geni nucleari di tutti gli organismi codificano le informazioni sulle proteine ​​allo stesso modo, indipendentemente dal livello di organizzazione e dalla posizione sistematica di questi organismi.

Esistere tabelle di codici genetici per la decrittazione codoni mRNA e costruzione di catene di molecole proteiche.

Reazioni di sintesi della matrice.

Reazioni sconosciute nella natura inanimata si verificano nei sistemi viventi - Reazioni di sintesi della matrice.

Il termine "matrice" in tecnologia designano uno stampo utilizzato per la fusione di monete, medaglie e caratteri tipografici: il metallo indurito riproduce esattamente tutti i dettagli dello stampo utilizzato per la fusione. Sintesi della matrice assomiglia alla fusione su una matrice: le nuove molecole vengono sintetizzate esattamente secondo il piano stabilito nella struttura delle molecole esistenti.

Il principio della matrice mente al centro le più importanti reazioni di sintesi della cellula, come la sintesi degli acidi nucleici e delle proteine. Queste reazioni garantiscono la sequenza esatta e strettamente specifica delle unità monomeriche nei polimeri sintetizzati.

C’è un’azione direzionale in corso qui. trascinando i monomeri in una posizione specifica cellule - in molecole che fungono da matrice in cui avviene la reazione. Se tali reazioni avvenissero a seguito di collisioni casuali di molecole, procederebbero con una lentezza infinita. La sintesi di molecole complesse basata sul principio del modello viene eseguita in modo rapido e accurato. Il ruolo della matrice le macromolecole degli acidi nucleici partecipano alle reazioni della matrice DNA o RNA .

Molecole monomeriche da cui viene sintetizzato il polimero - nucleotidi o amminoacidi - secondo il principio di complementarità, si trovano e fissati sulla matrice in un ordine rigorosamente definito e specificato.

Poi succede "reticolazione" di unità monomeriche in una catena polimerica, ed il polimero finito viene scaricato dalla matrice.

Dopo di che la matrice è pronta all’assemblaggio di una nuova molecola polimerica. È chiaro che come su un dato stampo si può colare una sola moneta o una sola lettera, così su una data molecola della matrice si può “assemblare” un solo polimero.

Tipo di reazione della matrice- una caratteristica specifica della chimica dei sistemi viventi. Sono la base della proprietà fondamentale di tutti gli esseri viventi: la capacità di riprodurre i propri simili.

Reazioni di sintesi del modello

1. replicazione del DNA - replicazione (dal latino replicatio - rinnovamento) - il processo di sintesi di una molecola figlia di acido desossiribonucleico sulla matrice della molecola di DNA genitore. Durante la successiva divisione della cellula madre, ciascuna cellula figlia riceve una copia di una molecola di DNA identica al DNA della cellula madre originale. Questo processo garantisce che le informazioni genetiche vengano trasmesse accuratamente di generazione in generazione. La replicazione del DNA viene effettuata da un complesso enzimatico costituito da 15-20 proteine ​​diverse, chiamate replisome . Il materiale per la sintesi sono i nucleotidi liberi presenti nel citoplasma delle cellule. Il significato biologico della replicazione risiede nel trasferimento accurato dell'informazione ereditaria dalla molecola madre alle molecole figlie, che normalmente avviene durante la divisione delle cellule somatiche.

Una molecola di DNA è costituita da due filamenti complementari. Queste catene sono tenute insieme da deboli legami idrogeno che possono essere spezzati dagli enzimi. La molecola di DNA è capace di autoduplicarsi (replicarsi) e su ciascuna vecchia metà della molecola viene sintetizzata una nuova metà.
Inoltre, una molecola di mRNA può essere sintetizzata su una molecola di DNA, che poi trasferisce le informazioni ricevute dal DNA al sito di sintesi proteica.

Il trasferimento delle informazioni e la sintesi proteica procedono secondo un principio a matrice, paragonabile al funzionamento di una macchina da stampa in una tipografia. Le informazioni dal DNA vengono copiate molte volte. Se si verificano errori durante la copia, verranno ripetuti in tutte le copie successive.

È vero, alcuni errori durante la copia delle informazioni con una molecola di DNA possono essere corretti: viene chiamato il processo di eliminazione degli errori risarcimento. La prima delle reazioni nel processo di trasferimento delle informazioni è la replicazione della molecola di DNA e la sintesi di nuove catene di DNA.

2. Trascrizione (dal latino transcriptio - riscrittura) - il processo di sintesi dell'RNA che utilizza il DNA come modello, che si verifica in tutte le cellule viventi. In altre parole, è il trasferimento dell’informazione genetica dal DNA all’RNA.

La trascrizione è catalizzata dall'enzima RNA polimerasi DNA-dipendente. L'RNA polimerasi si muove lungo la molecola di DNA nella direzione 3" → 5". La trascrizione è composta da fasi inizio, allungamento e terminazione . L'unità di trascrizione è un operone, un frammento di una molecola di DNA costituito da promotore, parte trascritta e terminatore . L'mRNA è costituito da un'unica catena ed è sintetizzato sul DNA secondo la regola della complementarità con la partecipazione di un enzima che attiva l'inizio e la fine della sintesi della molecola di mRNA.

La molecola di mRNA finita entra nel citoplasma sui ribosomi, dove avviene la sintesi delle catene polipeptidiche.

3. Trasmissione (dal lat. traduzione- trasferimento, movimento) - il processo di sintesi proteica da aminoacidi su una matrice di RNA informativo (messaggero) (mRNA, mRNA), effettuato dal ribosoma. In altre parole, questo è il processo di traduzione dell'informazione contenuta nella sequenza di nucleotidi dell'mRNA nella sequenza di aminoacidi del polipeptide.

4. Trascrizione inversa è il processo di formazione del DNA a doppio filamento basato sulle informazioni provenienti dall'RNA a filamento singolo. Questo processo è chiamato trascrizione inversa, poiché il trasferimento dell’informazione genetica avviene nella direzione “inversa” rispetto alla trascrizione. L’idea della trascrizione inversa era inizialmente molto impopolare perché contraddiceva il dogma centrale della biologia molecolare, che presupponeva che il DNA venisse trascritto in RNA e poi tradotto in proteine.

Tuttavia, nel 1970, Temin e Baltimora scoprirono indipendentemente un enzima chiamato trascrittasi inversa (revertasi) , e la possibilità della trascrizione inversa è stata finalmente confermata. Nel 1975, Temin e Baltimora ricevettero il Premio Nobel per la Fisiologia e la Medicina. Alcuni virus (come il virus dell’immunodeficienza umana, che causa l’infezione da HIV) hanno la capacità di trascrivere l’RNA in DNA. L'HIV ha un genoma di RNA integrato nel DNA. Di conseguenza, il DNA del virus può essere combinato con il genoma della cellula ospite. Viene chiamato l'enzima principale responsabile della sintesi del DNA dall'RNA invertire. Una delle funzioni del reversease è creare DNA complementare (cDNA) dal genoma virale. L'enzima associato ribonucleasi scinde l'RNA e la reverseasi sintetizza il cDNA dalla doppia elica del DNA. Il cDNA è integrato nel genoma della cellula ospite dall'integrasi. Il risultato è sintesi delle proteine ​​virali da parte della cellula ospite, che formano nuovi virus. Nel caso dell'HIV viene programmata anche l'apoptosi (morte cellulare) dei linfociti T. In altri casi, la cellula può rimanere un distributore di virus.

La sequenza delle reazioni della matrice durante la biosintesi proteica può essere rappresentata sotto forma di diagramma.

Così, biosintesi delle proteine- questo è uno dei tipi di scambio plastico, durante il quale le informazioni ereditarie codificate nei geni del DNA vengono implementate in una sequenza specifica di aminoacidi nelle molecole proteiche.

Le molecole proteiche sono essenzialmente catene polipeptidiche costituiti da singoli amminoacidi. Ma gli amminoacidi non sono abbastanza attivi da combinarsi tra loro da soli. Pertanto, prima di combinarsi tra loro e formare una molecola proteica, gli amminoacidi devono attivare . Questa attivazione avviene sotto l'azione di enzimi speciali.

In seguito all'attivazione l'amminoacido diventa più labile e, sotto l'azione dello stesso enzima, si lega al t- RNA. Ogni amminoacido corrisponde ad un t- strettamente specifico RNA, che trova il “suo” aminoacido e trasferimenti nel ribosoma.

Di conseguenza, diversi aminoacidi attivati ​​combinati con i propri T- RNA. Il ribosoma è come trasportatore per assemblare una catena proteica dai vari amminoacidi che le vengono forniti.

Contemporaneamente al t-RNA, su cui “si trova” il suo stesso amminoacido “ segnale"dal DNA contenuto nel nucleo. In base a questo segnale, l'una o l'altra proteina viene sintetizzata nel ribosoma.

L'influenza direttrice del DNA sulla sintesi proteica non viene effettuata direttamente, ma con l'aiuto di un intermediario speciale - matrice O RNA messaggero (m-RNA O mRNA), Quale sintetizzato nel nucleo e sotto l'influenza del DNA, quindi la sua composizione riflette la composizione del DNA. La molecola di RNA è come un calco della forma del DNA. L'mRNA sintetizzato entra nel ribosoma e, per così dire, lo trasferisce a questa struttura piano- in quale ordine devono essere combinati tra loro gli amminoacidi attivati ​​che entrano nel ribosoma affinché venga sintetizzata una specifica proteina? Altrimenti, l'informazione genetica codificata nel DNA viene trasferita all'mRNA e poi alle proteine.

La molecola di mRNA entra nel ribosoma e punti suo. Viene determinato quel segmento che si trova attualmente nel ribosoma codone (tripletto), interagisce in modo del tutto specifico con quelli che gli sono strutturalmente simili tripletta (anticodone) nell'RNA di trasferimento, che ha portato l'amminoacido nel ribosoma.

L'RNA di trasferimento con il suo amminoacido corrisponde a un codone specifico dell'mRNA e si collega con lui; alla successiva sezione vicina dell'mRNA viene aggiunto un altro tRNA con un amminoacido diverso e così via fino a leggere l'intera catena dell'i-RNA, fino a quando tutti gli amminoacidi si riducono nell'ordine appropriato, formando una molecola proteica. E il tRNA, che trasporta l'amminoacido in una parte specifica della catena polipeptidica, liberato dal suo amminoacido ed esce dal ribosoma.

Poi, sempre nel citoplasma, l'amminoacido desiderato può unirsi ad esso e trasferirlo nuovamente al ribosoma. Nel processo di sintesi proteica, non uno, ma diversi ribosomi sono coinvolti contemporaneamente: i poliribosomi.

Le fasi principali del trasferimento di informazioni genetiche:

1. Sintesi del DNA come modello per l'mRNA (trascrizione)
2. Sintesi di una catena polipeptidica nei ribosomi secondo il programma contenuto nell'mRNA (traduzione) .

Le fasi sono universali per tutti gli esseri viventi, ma le relazioni temporali e spaziali di questi processi differiscono nei pro- e negli eucarioti.

U procariote la trascrizione e la traduzione possono avvenire simultaneamente perché il DNA si trova nel citoplasma. U eucarioti trascrizione e traduzione sono strettamente separate nello spazio e nel tempo: nel nucleo avviene la sintesi dei vari RNA, dopodiché le molecole di RNA devono lasciare il nucleo attraversando la membrana nucleare. Gli RNA vengono poi trasportati nel citoplasma al sito di sintesi proteica.

Il codice genetico di diversi organismi ha alcune proprietà comuni:
1) Triplice. Per registrare qualsiasi informazione, comprese le informazioni ereditarie, viene utilizzato un determinato codice, il cui elemento è una lettera o un simbolo. L'insieme di tali simboli costituisce l'alfabeto. I singoli messaggi vengono scritti con una combinazione di caratteri chiamati gruppi di codici o codoni. Un alfabeto ben noto composto da soli due caratteri è il codice Morse. Ci sono 4 lettere nel DNA: le prime lettere dei nomi delle basi azotate (A, G, T, C), il che significa che l'alfabeto genetico è composto da soli 4 caratteri. Cos'è un gruppo di codice o una parola di un codice genetico? Sono conosciuti 20 aminoacidi basici, il cui contenuto deve essere scritto nel codice genetico, cioè 4 lettere devono corrispondere a 20 parole in codice. Diciamo che una parola è composta da un carattere, otterremo solo 4 gruppi di codici. Se la parola è composta da due caratteri, ci saranno solo 16 gruppi di questo tipo e questo chiaramente non è sufficiente per codificare 20 amminoacidi. Pertanto, la parola in codice deve contenere almeno 3 nucleotidi, che daranno 64 (43) combinazioni. Questo numero di combinazioni di triplette è abbastanza sufficiente per codificare tutti gli amminoacidi. Pertanto, un codone del codice genetico è una tripletta di nucleotidi.
2) La degenerazione (ridondanza) è una proprietà del codice genetico che consiste, da un lato, nel fatto che contiene terzine ridondanti, cioè sinonimi, e dall'altro terzine “prive di significato”. Poiché il codice comprende 64 combinazioni e sono codificati solo 20 aminoacidi, alcuni aminoacidi sono codificati da diverse triplette (arginina, serina, leucina - sei; valina, prolina, alanina, glicina, treonina - quattro; isoleucina - tre; fenilalanina, tirosina, istidina, lisina, asparagina, glutammina, cisteina, acido aspartico e glutammico - due; metionina e triptofano - una tripletta). Alcuni gruppi di codici (UAA, UAG, UGA) non portano alcun carico semantico, cioè sono terzine “prive di significato”. I codoni “senza senso” o senza senso funzionano come terminatori di catena – segni di punteggiatura nel testo genetico – che servono come segnale per la fine della sintesi della catena proteica. Questa ridondanza del codice è di grande importanza per aumentare l'affidabilità della trasmissione dell'informazione genetica.
3) Non sovrapposte. Le triplette di codici non si sovrappongono mai, cioè vengono sempre trasmesse insieme. Quando si leggono informazioni da una molecola di DNA, è impossibile utilizzare la base azotata di una tripletta in combinazione con le basi di un'altra tripletta.
4) Inequivocabilità. Non esistono casi in cui la stessa tripletta corrisponde a più di un acido.
5) Assenza di segni di separazione all'interno del gene. Il codice genetico viene letto da un luogo specifico senza virgole.
6) Versatilità. In diversi tipi di organismi viventi (virus, batteri, piante, funghi e animali), le stesse triplette codificano per gli stessi amminoacidi.
7) Specificità della specie. Il numero e la sequenza delle basi azotate nella catena del DNA varia da organismo a organismo.

Oggi non è un segreto per nessuno che il programma di vita di tutti gli organismi viventi sia scritto su una molecola di DNA. Il modo più semplice per immaginare una molecola di DNA è come una lunga scala. I montanti verticali di questa scala sono costituiti da molecole di zucchero, ossigeno e fosforo. Tutte le informazioni operative importanti nella molecola sono scritte sui pioli della scala: sono costituiti da due molecole, ciascuna delle quali è fissata a uno dei montanti verticali. Queste molecole, le basi azotate, sono chiamate adenina, guanina, timina e citosina, ma di solito sono semplicemente designate con le lettere A, G, T e C. La forma di queste molecole consente loro di formare legami - scale complete - solo di un certo tipo. Si tratta di connessioni tra le basi A e T e tra le basi G e C (la coppia così formata si chiama "coppia di basi"). Non possono esserci altri tipi di connessioni in una molecola di DNA.

Scendendo i gradini lungo un filamento di una molecola di DNA, si ottiene una sequenza di basi. È questo messaggio sotto forma di sequenza di basi che determina il flusso delle reazioni chimiche nella cellula e, di conseguenza, le caratteristiche dell'organismo che possiede questo DNA. Secondo il dogma centrale della biologia molecolare, la molecola del DNA codifica le informazioni sulle proteine, che a loro volta agiscono come enzimi ( cm. Catalizzatori ed enzimi) regolano tutte le reazioni chimiche negli organismi viventi.

La stretta corrispondenza tra la sequenza delle coppie di basi in una molecola di DNA e la sequenza di aminoacidi che compongono gli enzimi proteici è chiamata codice genetico. Il codice genetico fu decifrato subito dopo la scoperta della struttura a doppio filamento del DNA. Si sapeva che la molecola appena scoperta informativo, O matrice L'RNA (mRNA o mRNA) trasporta informazioni scritte sul DNA. I biochimici Marshall W. Nirenberg e J. Heinrich Matthaei del National Institutes of Health di Bethesda, vicino a Washington, D.C., condussero i primi esperimenti che portarono a indizi sul codice genetico.

Hanno iniziato sintetizzando molecole di mRNA artificiali costituite solo dalla base azotata ripetitiva uracile (che è un analogo della timina, "T", e forma legami solo con l'adenina, "A", della molecola di DNA). Hanno aggiunto questi mRNA a provette con una miscela di aminoacidi e in ciascuna provetta solo uno degli amminoacidi era etichettato con un marcatore radioattivo. I ricercatori hanno scoperto che l'mRNA da loro sintetizzato artificialmente avviava la formazione della proteina in una sola provetta, che conteneva l'amminoacido fenilalanina marcato. Stabilirono così che la sequenza “—U—U—U—” sulla molecola di mRNA (e, quindi, la sequenza equivalente “—A—A—A—” sulla molecola di DNA) codifica per una proteina costituita solo dall’amminoacido fenilalanina. Questo è stato il primo passo verso la decifrazione del codice genetico.

Oggi è noto che tre paia di basi di una molecola di DNA (questa tripletta è chiamata codone) codifica per un amminoacido in una proteina. Eseguendo esperimenti simili a quelli sopra descritti, i genetisti alla fine decifrarono l'intero codice genetico, in cui ciascuno dei 64 possibili codoni corrisponde a uno specifico amminoacido.

In precedenza, abbiamo sottolineato che i nucleotidi hanno una caratteristica importante per la formazione della vita sulla Terra: in presenza di una catena polinucleotidica in una soluzione, il processo di formazione di una seconda catena (parallela) avviene spontaneamente sulla base della connessione complementare di nucleotidi correlati . Lo stesso numero di nucleotidi in entrambe le catene e la loro affinità chimica sono una condizione indispensabile per la realizzazione di questo tipo di reazione. Tuttavia, durante la sintesi proteica, quando le informazioni provenienti dall'mRNA vengono implementate nella struttura proteica, non si può parlare di osservanza del principio di complementarità. Ciò è dovuto al fatto che nell'mRNA e nella proteina sintetizzata non solo il numero di monomeri è diverso ma, cosa particolarmente importante, non esiste alcuna somiglianza strutturale tra loro (nucleotidi da un lato, amminoacidi dall'altro ). È chiaro che in questo caso è necessario creare un nuovo principio per tradurre accuratamente le informazioni da un polinucleotide alla struttura di un polipeptide. Nell'evoluzione è stato creato un tale principio e la sua base era il codice genetico.

Il codice genetico è un sistema per registrare informazioni ereditarie nelle molecole di acido nucleico, basato su una certa alternanza di sequenze nucleotidiche nel DNA o RNA, formando codoni corrispondenti agli amminoacidi in una proteina.

Il codice genetico ha diverse proprietà.

    Triplicità.

    Degenerazione o ridondanza.

    Inequivocabilità.

    Polarità.

    Non sovrapponibile.

    Compattezza.

    Versatilità.

Va notato che alcuni autori propongono anche altre proprietà del codice legate alle caratteristiche chimiche dei nucleotidi inclusi nel codice o alla frequenza di presenza dei singoli aminoacidi nelle proteine ​​del corpo, ecc. Tuttavia, queste proprietà derivano da quelle sopra elencate, quindi le considereremo lì.

UN. Triplicità. Il codice genetico, come molti sistemi organizzati in modo complesso, ha la più piccola unità strutturale e funzionale. Una tripletta è la più piccola unità strutturale del codice genetico. È costituito da tre nucleotidi. Un codone è la più piccola unità funzionale del codice genetico. Tipicamente, le triplette di mRNA sono chiamate codoni. Nel codice genetico, un codone svolge diverse funzioni. Innanzitutto, la sua funzione principale è quella di codificare un singolo amminoacido. In secondo luogo, il codone potrebbe non codificare per un amminoacido, ma, in questo caso, svolge un'altra funzione (vedi sotto). Come si può vedere dalla definizione, una terzina è un concetto che caratterizza elementare unità strutturale codice genetico (tre nucleotidi). Codone – caratterizza unità semantica elementare genoma: tre nucleotidi determinano l'attaccamento di un amminoacido alla catena polipeptidica.

L'unità strutturale elementare è stata prima decifrata teoricamente e poi la sua esistenza è stata confermata sperimentalmente. Infatti, 20 aminoacidi non possono essere codificati con uno o due nucleotidi perché di questi ultimi ce ne sono solo 4. Tre nucleotidi su quattro danno 4 3 = 64 varianti, che coprono più che il numero di amminoacidi disponibili negli organismi viventi (vedi Tabella 1).

Le 64 combinazioni nucleotidiche presentate nella tabella hanno due caratteristiche. Innanzitutto, delle 64 varianti tripletta, solo 61 sono codoni e codificano qualsiasi amminoacido; sono chiamati codoni di senso. Tre triplette non codificano

Tabella 1.

Codoni dell'RNA messaggero e corrispondenti aminoacidi

FONDAZIONE DI KODONOV

Senza senso

Senza senso

Senza senso

Meth

Lancia

gli amminoacidi a sono segnali di stop che indicano la fine della traduzione. Ci sono tre di queste terzine - UAA, UAG, UGA, sono anche detti “privi di significato” (codoni senza senso). Come risultato di una mutazione, che è associata alla sostituzione di un nucleotide in una tripletta con un altro, da un codone di senso può derivare un codone senza senso. Questo tipo di mutazione si chiama mutazione senza senso. Se un tale segnale di arresto si forma all'interno del gene (nella sua parte informativa), durante la sintesi proteica in questo luogo il processo verrà costantemente interrotto: verrà sintetizzata solo la prima parte (prima del segnale di arresto) della proteina. Una persona con questa patologia sperimenterà una carenza di proteine ​​e avvertirà i sintomi associati a questa carenza. Ad esempio, questo tipo di mutazione è stata identificata nel gene che codifica per la catena beta dell'emoglobina. Viene sintetizzata una catena di emoglobina inattiva accorciata, che viene rapidamente distrutta. Di conseguenza, si forma una molecola di emoglobina priva di catena beta. È chiaro che è improbabile che una tale molecola adempia pienamente ai suoi compiti. Si verifica una malattia grave che si sviluppa come anemia emolitica (talassemia beta-zero, dalla parola greca "Thalas" - Mar Mediterraneo, dove questa malattia è stata scoperta per la prima volta).

Il meccanismo d'azione dei codoni di stop differisce dal meccanismo d'azione dei codoni di senso. Ciò deriva dal fatto che per tutti i codoni che codificano gli amminoacidi sono stati trovati tRNA corrispondenti. Non è stato trovato tRNA per codoni senza senso. Di conseguenza, il tRNA non prende parte al processo di arresto della sintesi proteica.

CodoneAGOSTO (a volte GUG nei batteri) non solo codificano gli aminoacidi metionina e valina, ma sono ancheiniziatore della trasmissione .

B. Degenerazione o ridondanza.

61 delle 64 triplette codificano 20 aminoacidi. Questo eccesso di tre volte del numero di triplette rispetto al numero di amminoacidi suggerisce che nel trasferimento delle informazioni possono essere utilizzate due opzioni di codifica. In primo luogo, non tutti i 64 codoni possono essere coinvolti nella codifica di 20 aminoacidi, ma solo 20 e, in secondo luogo, gli aminoacidi possono essere codificati da diversi codoni. La ricerca ha dimostrato che la natura ha utilizzato quest’ultima opzione.

La sua preferenza è ovvia. Se su 64 triplette varianti solo 20 fossero coinvolte nella codifica degli aminoacidi, allora 44 triplette (su 64) rimarrebbero non codificanti, cioè privi di significato (codoni senza senso). In precedenza, abbiamo sottolineato quanto sia pericoloso per la vita di una cellula trasformare una tripletta codificante a seguito di una mutazione in un codone senza senso: ciò interrompe in modo significativo il normale funzionamento della RNA polimerasi, portando infine allo sviluppo di malattie. Attualmente, tre codoni nel nostro genoma non hanno senso, ma ora immaginiamo cosa accadrebbe se il numero di codoni senza senso aumentasse di circa 15 volte. È chiaro che in una situazione del genere la transizione dai codoni normali ai codoni senza senso sarà incommensurabilmente più alta.

Un codice in cui un amminoacido è codificato da più triplette è detto degenerato o ridondante. Quasi ogni amminoacido ha diversi codoni. Pertanto, l'amminoacido leucina può essere codificato da sei triplette: UUA, UUG, TSUU, TsUC, TsUA, TsUG. La valina è codificata da quattro triplette, la fenilalanina da due e sole triptofano e metionina codificato da un codone. Viene chiamata la proprietà associata alla registrazione delle stesse informazioni con simboli diversi degenerazione.

Il numero di codoni designati per un amminoacido è ben correlato alla frequenza con cui l'amminoacido si presenta nelle proteine.

E questo molto probabilmente non è casuale. Maggiore è la frequenza di presenza di un amminoacido in una proteina, più spesso il codone di questo amminoacido è rappresentato nel genoma, maggiore è la probabilità del suo danno da parte di fattori mutageni. Pertanto è chiaro che un codone mutato ha maggiori possibilità di codificare lo stesso amminoacido se è altamente degenerato. Da questo punto di vista, la degenerazione del codice genetico è un meccanismo che protegge il genoma umano dai danni.

Va notato che il termine degenerazione è usato nella genetica molecolare in un altro senso. Pertanto, la maggior parte dell'informazione in un codone è contenuta nei primi due nucleotidi; la base nella terza posizione del codone risulta essere di scarsa importanza. Questo fenomeno è chiamato “degenerazione della terza base”. Quest'ultima caratteristica minimizza l'effetto delle mutazioni. Ad esempio, è noto che la funzione principale dei globuli rossi è quella di trasportare l'ossigeno dai polmoni ai tessuti e l'anidride carbonica dai tessuti ai polmoni. Questa funzione è eseguita dal pigmento respiratorio: l'emoglobina, che riempie l'intero citoplasma dell'eritrocita. Consiste in una parte proteica: la globina, codificata dal gene corrispondente. Oltre alle proteine, la molecola dell'emoglobina contiene l'eme, che contiene ferro. Le mutazioni nei geni globinici portano alla comparsa di diverse varianti di emoglobine. Molto spesso sono associate mutazioni sostituzione di un nucleotide con un altro e comparsa di un nuovo codone nel gene, che può codificare un nuovo amminoacido nella catena polipeptidica dell'emoglobina. In una tripletta, a seguito della mutazione, qualsiasi nucleotide può essere sostituito: il primo, il secondo o il terzo. Sono note diverse centinaia di mutazioni che influenzano l'integrità dei geni globinici. Vicino 400 di cui sono associati alla sostituzione di singoli nucleotidi in un gene e alla corrispondente sostituzione di amminoacidi in un polipeptide. Di questi solo 100 le sostituzioni portano all'instabilità dell'emoglobina e a vari tipi di malattie da lievi a molto gravi. 300 (circa il 64%) mutazioni di sostituzione non influenzano la funzione dell'emoglobina e non portano a patologie. Uno dei motivi di ciò è la già citata “degenerazione della terza base”, quando la sostituzione del terzo nucleotide in una tripletta che codifica serina, leucina, prolina, arginina e alcuni altri amminoacidi porta alla comparsa di un codone sinonimo codificanti lo stesso amminoacido. Tale mutazione non si manifesterà fenotipicamente. Al contrario, qualsiasi sostituzione del primo o del secondo nucleotide in una tripletta porta nel 100% dei casi alla comparsa di una nuova variante dell'emoglobina. Ma anche in questo caso potrebbero non esserci gravi disturbi fenotipici. La ragione di ciò è la sostituzione di un amminoacido nell'emoglobina con un altro simile al primo nelle proprietà fisico-chimiche. Ad esempio, se un amminoacido con proprietà idrofile viene sostituito da un altro amminoacido, ma con le stesse proprietà.

L'emoglobina è costituita dal gruppo porfirinico di ferro dell'eme (ad esso sono attaccate molecole di ossigeno e anidride carbonica) e dalla proteina - globina. L'emoglobina adulta (HbA1c) ne contiene due identici-catene e due-Catene. Molecola-la catena contiene 141 residui di aminoacidi,-catena - 146,- E-le catene differiscono per molti residui amminoacidici. La sequenza aminoacidica di ciascuna catena globinica è codificata dal proprio gene. Codifica genetica-la catena si trova nel braccio corto del cromosoma 16,-gene - nel braccio corto del cromosoma 11. Sostituzione nella codifica del gene-la catena dell'emoglobina del primo o del secondo nucleotide porta quasi sempre alla comparsa di nuovi aminoacidi nella proteina, all'interruzione delle funzioni dell'emoglobina e a gravi conseguenze per il paziente. Ad esempio, la sostituzione della "C" in una delle triplette CAU (istidina) con la "Y" porterà alla comparsa di una nuova tripletta UAU, che codifica per un altro amminoacido, la tirosina, e fenotipicamente si manifesterà in una malattia grave. sostituzione simile nella posizione 63La catena del polipeptide dell'istidina in tirosina porterà alla destabilizzazione dell'emoglobina. Si sviluppa la malattia metaemoglobinemia. Sostituzione, a seguito di mutazione, dell'acido glutammico con valina in 6a posizione-catena è la causa della malattia più grave: l'anemia falciforme. Non continuiamo la triste lista. Notiamo solo che sostituendo i primi due nucleotidi può apparire un amminoacido con proprietà fisico-chimiche simili al precedente. Pertanto, la sostituzione del 2° nucleotide in una delle triplette che codificano l'acido glutammico (GAA) in-la catena con “U” porta alla comparsa di una nuova tripletta (GUA), che codifica per la valina, e sostituendo il primo nucleotide con “A” forma la tripletta AAA, che codifica per l'amminoacido lisina. L'acido glutammico e la lisina hanno proprietà fisico-chimiche simili: sono entrambi idrofili. La valina è un amminoacido idrofobico. Pertanto, la sostituzione dell'acido glutammico idrofilo con la valina idrofobica modifica significativamente le proprietà dell'emoglobina, che alla fine porta allo sviluppo dell'anemia falciforme, mentre la sostituzione dell'acido glutammico idrofilo con la lisina idrofila modifica la funzione dell'emoglobina in misura minore: i pazienti sviluppano una forma lieve di anemia. Come risultato della sostituzione della terza base, la nuova tripletta può codificare gli stessi aminoacidi della precedente. Ad esempio, se nella tripletta CAC l'uracile fosse sostituito dalla citosina e apparisse una tripletta CAC, nell'uomo non verrà rilevato praticamente alcun cambiamento fenotipico. Questo è comprensibile, perché entrambe le triplette codificano per lo stesso amminoacido: l'istidina.

In conclusione, è opportuno sottolineare che la degenerazione del codice genetico e la degenerazione della terza base da un punto di vista biologico generale sono meccanismi protettivi insiti nell'evoluzione nella struttura unica del DNA e dell'RNA.

V. Inequivocabilità.

Ogni tripletta (tranne le sciocchezze) codifica solo un amminoacido. Pertanto, nella direzione codone - amminoacido il codice genetico non è ambiguo, nella direzione amminoacido - codone è ambiguo (degenerato).

Inequivocabile

Codone dell'amminoacido

Degenerare

E in questo caso, la necessità di univocità nel codice genetico è ovvia. In un'altra opzione, traducendo lo stesso codone, diversi amminoacidi verrebbero inseriti nella catena proteica e, di conseguenza, si formerebbero proteine ​​con diverse strutture primarie e diverse funzioni. Il metabolismo cellulare passerebbe alla modalità operativa “un gene – diversi polipeptidi”. È chiaro che in una situazione del genere la funzione regolatrice dei geni verrebbe completamente persa.

g. Polarità

La lettura delle informazioni dal DNA e dall'mRNA avviene solo in una direzione. La polarità è importante per definire strutture di ordine superiore (secondaria, terziaria, ecc.). In precedenza abbiamo parlato di come le strutture di ordine inferiore determinano le strutture di ordine superiore. La struttura terziaria e le strutture di ordine superiore nelle proteine ​​si formano non appena la catena di RNA sintetizzata lascia la molecola di DNA o la catena polipeptidica lascia il ribosoma. Mentre l'estremità libera di un RNA o di un polipeptide acquisisce una struttura terziaria, l'altra estremità della catena continua ad essere sintetizzata sul DNA (se viene trascritto l'RNA) o su un ribosoma (se viene trascritto un polipeptide).

Pertanto, il processo unidirezionale di lettura delle informazioni (durante la sintesi di RNA e proteine) è essenziale non solo per determinare la sequenza di nucleotidi o amminoacidi nella sostanza sintetizzata, ma per la determinazione rigorosa di secondario, terziario, ecc. strutture.

d. Non sovrapposti.

Il codice può essere sovrapposto o non sovrapposto. La maggior parte degli organismi ha un codice non sovrapposto. Il codice sovrapposto si trova in alcuni fagi.

L'essenza di un codice non sovrapposto è che un nucleotide di un codone non può essere contemporaneamente un nucleotide di un altro codone. Se il codice fosse sovrapposto, allora la sequenza di sette nucleotidi (GCUGCUG) potrebbe codificare non due aminoacidi (alanina-alanina) (Fig. 33, A) come nel caso di un codice non sovrapposto, ma tre (se esiste un nucleotide in comune) (Fig. 33, B) o cinque (se due nucleotidi sono comuni) (vedi Fig. 33, C). Negli ultimi due casi, una mutazione di qualsiasi nucleotide porterebbe ad una violazione nella sequenza di due, tre, ecc. aminoacidi.

Tuttavia, è stato stabilito che una mutazione di un nucleotide interrompe sempre l'inclusione di un amminoacido in un polipeptide. Questo è un argomento significativo secondo cui il codice non si sovrappone.

Spieghiamolo nella Figura 34. Le linee in grassetto mostrano triplette che codificano amminoacidi nel caso di codice non sovrapposto e sovrapposto. Gli esperimenti hanno chiaramente dimostrato che il codice genetico non si sovrappone. Senza entrare nei dettagli dell'esperimento, notiamo che se si sostituisce il terzo nucleotide nella sequenza dei nucleotidi (vedi Fig. 34)U (contrassegnato con un asterisco) a qualche altra cosa:

1. Con un codice non sovrapposto, la proteina controllata da questa sequenza avrebbe una sostituzione di un (primo) amminoacido (contrassegnato con asterischi).

2. Con un codice sovrapposto nell'opzione A, si verificherebbe una sostituzione in due (primo e secondo) amminoacidi (contrassegnati con asterischi). Secondo l'opzione B, la sostituzione riguarderebbe tre aminoacidi (contrassegnati con asterischi).

Tuttavia, numerosi esperimenti hanno dimostrato che quando un nucleotide nel DNA viene distrutto, la rottura della proteina colpisce sempre solo un amminoacido, cosa tipica di un codice non sovrapposto.

GZUGZUG GZUGZUG GZUGZUG

GCU GCU GCU UGC GCU GCU GCU UGC GCU GCU GCU

*** *** *** *** *** ***

Alanina - Alanina Ala - Cis - Ley Ala - Ley - Ley - Ala - Ley

A B C

Codice non sovrapposto Codice sovrapposto

Riso. 34. Un diagramma che spiega la presenza di un codice non sovrapposto nel genoma (spiegazione nel testo).

La non sovrapposizione del codice genetico è associata ad un'altra proprietà - la lettura delle informazioni inizia da un certo punto - il segnale di inizio. Un tale segnale di inizio nell'mRNA è il codone che codifica la metionina AUG.

Va notato che una persona ha ancora un piccolo numero di geni che si discostano dalla regola generale e si sovrappongono.

e. Compattezza.

Non c'è punteggiatura tra i codoni. In altre parole, le triplette non sono separate l'una dall'altra, ad esempio da un nucleotide senza significato. L'assenza di "segni di punteggiatura" nel codice genetico è stata dimostrata mediante esperimenti.

E. Versatilità.

Il codice è lo stesso per tutti gli organismi che vivono sulla Terra. La prova diretta dell'universalità del codice genetico è stata ottenuta confrontando le sequenze di DNA con le corrispondenti sequenze proteiche. Si è scoperto che tutti i genomi batterici ed eucariotici utilizzano gli stessi set di valori di codice. Ci sono eccezioni, ma non molte.

Le prime eccezioni all'universalità del codice genetico sono state riscontrate nei mitocondri di alcune specie animali. Ciò riguardava il codone terminatore UGA, che si legge uguale al codone UGG, che codifica per l'amminoacido triptofano. Sono state trovate anche altre deviazioni più rare dall'universalità.

MZ. Il codice genetico è un sistema per registrare informazioni ereditarie nelle molecole di acido nucleico, basato su una certa alternanza di sequenze nucleotidiche nel DNA o RNA che formano codoni,

corrispondenti agli aminoacidi delle proteine.Il codice genetico ha diverse proprietà.