Le proprietà del codice genetico includono. Codice nel codice: rivelato il secondo codice genetico

Nel metabolismo del corpo ruolo di primo piano appartiene alle proteine ​​e agli acidi nucleici.
Le sostanze proteiche costituiscono la base di tutte le strutture cellulari vitali, hanno una reattività insolitamente elevata e sono dotate di funzioni catalitiche.
Gli acidi nucleici fanno parte dell'organo cellulare più importante: il nucleo, così come il citoplasma, i ribosomi, i mitocondri, ecc. Gli acidi nucleici svolgono un ruolo importante e primario nell'ereditarietà, nella variabilità corporea e nella sintesi proteica.

Piano sintesi le proteine ​​sono immagazzinate nel nucleo della cellula e la sintesi diretta avviene all'esterno del nucleo, quindi è necessaria servizio di consegna codificato piano dal nucleo al sito di sintesi. Questo servizio di consegna viene eseguito da molecole di RNA.

Il processo inizia alle nucleo cellule: parte della "scala" del DNA si srotola e si apre. Per questo motivo, le lettere dell'RNA formano legami con le lettere del DNA aperte di uno dei filamenti del DNA. L'enzima trasferisce le lettere dell'RNA per collegarle in un filo. Quindi le lettere del DNA vengono "riscritte" nelle lettere dell'RNA. La catena di RNA appena formata viene separata e la "scala" del DNA si attorciglia nuovamente. Viene chiamato il processo di lettura delle informazioni dal DNA e di sintesi del suo modello di RNA trascrizione , e l'RNA sintetizzato è chiamato informativo o i-RNA .

Dopo ulteriori modifiche, questo tipo di mRNA codificato è pronto. i-RNA esce dal nucleo e va al sito della sintesi proteica, dove vengono decifrate le lettere i-RNA. Ciascun insieme di tre lettere di i-RNA forma una "lettera" che rappresenta un particolare amminoacido.

Un altro tipo di RNA cerca questo amminoacido, lo cattura con l'aiuto di un enzima e lo consegna al sito di sintesi proteica. Questo RNA è chiamato RNA di trasferimento o tRNA. Man mano che il messaggio dell'mRNA viene letto e tradotto, la catena di aminoacidi cresce. Questa catena si attorciglia e si piega in una forma unica, creando un tipo di proteina. Anche il processo di ripiegamento delle proteine ​​è notevole: basta usare un computer per calcolare tutto opzioni ci vorrebbero 1027 (!) anni per ripiegare una proteina di medie dimensioni composta da 100 aminoacidi. E non ci vuole più di un secondo per formare una catena di 20 aminoacidi nel corpo e questo processo avviene continuamente in tutte le cellule del corpo.

Geni, codice genetico e sue proprietà.

Sulla Terra vivono circa 7 miliardi di persone. Fatta eccezione per 25-30 milioni di coppie di gemelli identici, quindi geneticamente tutte le persone sono diverse : ognuno è unico, ha caratteristiche ereditarie, tratti caratteriali, abilità, temperamento unici.

Tali differenze sono spiegate differenze nei genotipi- serie di geni di un organismo; ognuno è unico. I tratti genetici di un particolare organismo sono incarnati nelle proteine - di conseguenza, la struttura della proteina di una persona differisce, anche se di poco, dalla proteina di un'altra persona.

Non significa che gli esseri umani non hanno esattamente le stesse proteine. Le proteine ​​che svolgono le stesse funzioni possono essere uguali o differire leggermente l'una dall'altra per uno o due amminoacidi. Ma non esiste sulla Terra delle persone (ad eccezione dei gemelli identici), in cui sarebbero tutte le proteine sono gli stessi .

Informazioni sulla struttura primaria di una proteina codificato come una sequenza di nucleotidi in una sezione di una molecola di DNA, gene - un'unità di informazione ereditaria di un organismo. Ogni molecola di DNA contiene molti geni. L'insieme di tutti i geni di un organismo lo costituisce genotipo . Così,

Un gene è un'unità di informazione ereditaria di un organismo, che corrisponde a una sezione separata del DNA

Le informazioni ereditarie vengono codificate utilizzando codice genetico , che è universale per tutti gli organismi e differisce solo nell'alternanza di nucleotidi che formano geni e codificano per proteine ​​di organismi specifici.

Codice genetico è costituito da triplette (triplette) di nucleotidi del DNA che si combinano in sequenze diverse (AAT, HCA, ACH, THC, ecc.), ciascuna delle quali codifica per uno specifico amminoacido (che verrà incorporato nella catena polipeptidica).

In realtà codice conta sequenza di nucleotidi in una molecola di i-RNA , Perché rimuove le informazioni dal DNA (il processo trascrizioni ) e lo traduce in una sequenza di aminoacidi nelle molecole delle proteine ​​sintetizzate (processo trasmissioni ).
La composizione dell'mRNA comprende nucleotidi A-C-G-U, le cui triplette sono chiamate codoni : la tripletta di DNA CHT sull'mRNA diventerà la tripletta di HCA e la tripletta di DNA AAG diventerà la tripletta di UUC. Esattamente Codoni i-RNA riflette il codice genetico nel record.

Così, codice genetico - un sistema unificato per la registrazione di informazioni ereditarie in molecole di acido nucleico sotto forma di una sequenza di nucleotidi . Il codice genetico si basa sull'utilizzo di un alfabeto formato da sole quattro lettere nucleotidiche che differiscono per le basi azotate: A, T, G, C.

Le principali proprietà del codice genetico:

1. Codice genetico tripletta. Una tripletta (codone) è una sequenza di tre nucleotidi che codifica per un amminoacido. Poiché le proteine ​​contengono 20 aminoacidi, è ovvio che ciascuno di essi non può essere codificato da un nucleotide ( poiché nel DNA ci sono solo quattro tipi di nucleotidi, in questo caso 16 amminoacidi rimangono non codificati). Anche due nucleotidi per codificare gli amminoacidi non sono sufficienti, poiché in questo caso possono essere codificati solo 16 amminoacidi. Ciò significa che il numero più piccolo di nucleotidi che codificano un amminoacido deve essere almeno tre. In questo caso, il numero di possibili triplette nucleotidiche è 43 = 64.

2. Ridondanza (degenerazione) Il codice è una conseguenza della sua natura di tripletta e significa che un amminoacido può essere codificato da diverse triplette (poiché ci sono 20 amminoacidi e ci sono 64 triplette), con l'eccezione della metionina e del triptofano, che sono codificati da un solo amminoacido. tripletta. Inoltre, alcune triplette svolgono funzioni specifiche: nella molecola dell'mRNA, le triplette UAA, UAG, UGA sono codoni terminali, cioè fermare-segnali che fermano la sintesi della catena polipeptidica. La tripletta corrispondente alla metionina (AUG), situata all'inizio della catena del DNA, non codifica un amminoacido, ma svolge la funzione di inizio (eccitazione) della lettura.

3. Inequivocabilità codice - insieme alla ridondanza, il codice ha la proprietà unicità : ogni codone corrisponde solo uno amminoacido specifico.

4. Collinearità codice, cioè sequenza di nucleotidi in un gene esattamente corrisponde alla sequenza degli aminoacidi nella proteina.

5. Codice genetico non sovrapposti e compatti , cioè non contiene "segni di punteggiatura". Ciò significa che il processo di lettura non prevede la possibilità di sovrapposizione di colonne (triplette) e, a partire da un certo codone, la lettura procede continuamente tripla per tripletta fino a quando fermare-segnali ( codoni di terminazione).

6. Codice genetico universale , cioè, i geni nucleari di tutti gli organismi codificano le informazioni sulle proteine ​​allo stesso modo, indipendentemente dal livello di organizzazione e dalla posizione sistematica di questi organismi.

Esistere tabelle di codici genetici per la decrittazione codoni i-RNA e costruzione di catene di molecole proteiche.

Reazioni di sintesi della matrice.

Nei sistemi viventi ci sono reazioni sconosciute alla natura inanimata - Reazioni di sintesi della matrice.

Il termine "matrice" nella tecnologia denotano la forma utilizzata per la fusione di monete, medaglie, caratteri tipografici: il metallo indurito riproduce esattamente tutti i dettagli della forma utilizzata per la fusione. Sintesi della matrice assomiglia a un casting su una matrice: nuove molecole vengono sintetizzate in stretta conformità con il piano stabilito nella struttura delle molecole già esistenti.

Il principio della matrice mente al centro le più importanti reazioni di sintesi della cellula, come la sintesi degli acidi nucleici e delle proteine. In queste reazioni viene fornita una sequenza esatta e strettamente specifica di unità monomeriche nei polimeri sintetizzati.

Questo è dove direzionale trascinando i monomeri in una posizione specifica cellule - in molecole che fungono da matrice in cui avviene la reazione. Se tali reazioni avvenissero a seguito di una collisione casuale di molecole, procederebbero con una lentezza infinita. La sintesi di molecole complesse basata sul principio della matrice viene eseguita in modo rapido e accurato. Il ruolo della matrice le macromolecole degli acidi nucleici partecipano alle reazioni della matrice DNA o RNA .

molecole monomeriche, da cui viene sintetizzato il polimero - nucleotidi o amminoacidi - secondo il principio di complementarità sono disposti e fissati sulla matrice in un ordine predeterminato rigorosamente definito.

Poi arriva "reticolazione" di unità monomeriche in una catena polimerica e il polimero finito viene fatto cadere dalla matrice.

Dopo di che matrice pronta all’assemblaggio di una nuova molecola polimerica. È chiaro che come su un dato stampo può essere fusa una sola moneta, una sola lettera, così su una data molecola di matrice può essere “assemblato” un solo polimero.

Reazioni di tipo matriciale- una caratteristica specifica della chimica dei sistemi viventi. Sono la base della proprietà fondamentale di tutti gli esseri viventi: la capacità di riprodurre i propri simili.

Reazioni di sintesi della matrice

1. replicazione del DNA - replicazione (dal lat. replicatio - rinnovamento) - il processo di sintesi di una molecola figlia di acido desossiribonucleico sulla matrice della molecola di DNA genitore. Durante la successiva divisione della cellula madre, ciascuna cellula figlia riceve una copia di una molecola di DNA identica al DNA della cellula madre originale. Questo processo garantisce la trasmissione accurata delle informazioni genetiche di generazione in generazione. La replicazione del DNA viene effettuata da un complesso enzimatico, costituito da 15-20 proteine ​​diverse, chiamate replisome . Il materiale per la sintesi sono i nucleotidi liberi presenti nel citoplasma delle cellule. Il significato biologico della replicazione risiede nell'esatto trasferimento dell'informazione ereditaria dalla molecola madre a quelle figlie, che normalmente avviene durante la divisione delle cellule somatiche.

La molecola del DNA è costituita da due filamenti complementari. Queste catene sono tenute insieme da deboli legami idrogeno che possono essere spezzati dagli enzimi. La molecola di DNA è in grado di auto-raddoppiarsi (replicarsi) e una nuova metà di essa viene sintetizzata su ciascuna vecchia metà della molecola.
Inoltre, una molecola di mRNA può essere sintetizzata su una molecola di DNA, che poi trasferisce le informazioni ricevute dal DNA al sito di sintesi proteica.

Il trasferimento delle informazioni e la sintesi proteica seguono un principio a matrice, paragonabile al lavoro di una macchina da stampa in una tipografia. Le informazioni dal DNA vengono copiate più e più volte. Se si verificano errori durante la copia, verranno ripetuti in tutte le copie successive.

È vero, alcuni errori nella copia delle informazioni da parte di una molecola di DNA possono essere corretti: viene chiamato il processo di eliminazione degli errori riparazioni. La prima delle reazioni nel processo di trasferimento delle informazioni è la replicazione della molecola di DNA e la sintesi di nuovi filamenti di DNA.

2. Trascrizione (dal latino transcriptio - riscrittura) - il processo di sintesi dell'RNA che utilizza il DNA come modello, che si verifica in tutte le cellule viventi. In altre parole, è il trasferimento dell’informazione genetica dal DNA all’RNA.

La trascrizione è catalizzata dall'enzima RNA polimerasi DNA-dipendente. L'RNA polimerasi si muove lungo la molecola di DNA nella direzione 3 "→ 5". La trascrizione è composta da passaggi inizio, allungamento e terminazione . L'unità di trascrizione è l'operone, un frammento della molecola di DNA costituito da promotore, porzione trascritta e terminatore . l'i-RNA è costituito da un filamento ed è sintetizzato sul DNA secondo la regola della complementarità con la partecipazione di un enzima che attiva l'inizio e la fine della sintesi della molecola i-RNA.

La molecola di mRNA finita entra nel citoplasma sui ribosomi, dove avviene la sintesi delle catene polipeptidiche.

3. Trasmissione (dal lat. traduzione- trasferimento, movimento) - il processo di sintesi proteica dagli amminoacidi sulla matrice di informazioni (matrice) RNA (mRNA, mRNA) effettuato dal ribosoma. In altre parole, questo è il processo di traduzione dell'informazione contenuta nella sequenza nucleotidica dell'i-RNA nella sequenza di aminoacidi del polipeptide.

4. trascrizione inversa è il processo di formazione del DNA a doppio filamento basato sulle informazioni provenienti dall'RNA a filamento singolo. Questo processo è chiamato trascrizione inversa, poiché il trasferimento dell’informazione genetica avviene nella direzione “inversa” rispetto alla trascrizione. L’idea della trascrizione inversa era inizialmente molto impopolare, poiché andava contro il dogma centrale della biologia molecolare, che presupponeva che il DNA venisse trascritto in RNA e poi tradotto in proteine.

Tuttavia, nel 1970, Temin e Baltimora scoprirono indipendentemente un enzima chiamato trascrittasi inversa (revertasi) , e la possibilità della trascrizione inversa è stata finalmente confermata. Nel 1975, Temin e Baltimora ricevettero il Premio Nobel per la Fisiologia e la Medicina. Alcuni virus (come il virus dell’immunodeficienza umana che causa l’infezione da HIV) hanno la capacità di trascrivere l’RNA in DNA. L'HIV ha un genoma di RNA che si integra nel DNA. Di conseguenza, il DNA del virus può essere combinato con il genoma della cellula ospite. Viene chiamato l'enzima principale responsabile della sintesi del DNA dall'RNA invertire. Una delle funzioni del reversease è creare DNA complementare (cDNA) dal genoma virale. L'enzima associato ribonucleasi scinde l'RNA e la reversetasi sintetizza il cDNA dalla doppia elica del DNA. Il cDNA è integrato nel genoma della cellula ospite dall'integrasi. Il risultato è sintesi delle proteine ​​virali da parte della cellula ospite che formano nuovi virus. Nel caso dell'HIV viene programmata anche l'apoptosi (morte cellulare) dei linfociti T. In altri casi, la cellula può rimanere un distributore di virus.

La sequenza delle reazioni della matrice nella biosintesi proteica può essere rappresentata come un diagramma.

Così, biosintesi delle proteine- questo è uno dei tipi di scambio plastico, durante il quale l'informazione ereditaria codificata nei geni del DNA si realizza in una certa sequenza di aminoacidi nelle molecole proteiche.

Le molecole proteiche sono essenzialmente catene polipeptidiche costituiti da singoli amminoacidi. Ma gli amminoacidi non sono abbastanza attivi per connettersi tra loro da soli. Pertanto, prima di combinarsi tra loro e formare una molecola proteica, gli amminoacidi devono attivare . Questa attivazione avviene sotto l'azione di enzimi speciali.

In seguito all'attivazione l'amminoacido diventa più labile e, sotto l'azione dello stesso enzima, si lega al t- RNA. Ogni amminoacido corrisponde ad un t- strettamente specifico RNA, che trova il "suo" amminoacido e resiste nel ribosoma.

Pertanto, il ribosoma riceve vari aminoacidi attivati ​​legati al loro T- RNA. Il ribosoma è come trasportatore per assemblare una catena proteica da vari amminoacidi che vi entrano.

Contemporaneamente al t-RNA, su cui "si trova" il suo stesso amminoacido " segnale» dal DNA che è contenuto nel nucleo. In base a questo segnale, l'una o l'altra proteina viene sintetizzata nel ribosoma.

L'influenza direttrice del DNA sulla sintesi proteica non viene effettuata direttamente, ma con l'aiuto di un intermediario speciale - matrice O RNA messaggero (mRNA O i-RNA), Quale sintetizzato nel nucleo Non è influenzato dal DNA, quindi la sua composizione riflette la composizione del DNA. La molecola di RNA è, per così dire, un calco della forma del DNA. L'mRNA sintetizzato entra nel ribosoma e, per così dire, lo trasferisce a questa struttura piano- in quale ordine gli amminoacidi attivati ​​che entrano nel ribosoma devono essere combinati tra loro per sintetizzare una determinata proteina. Altrimenti, l'informazione genetica codificata nel DNA viene trasferita all'mRNA e poi alle proteine.

La molecola di mRNA entra nel ribosoma e lampeggia suo. Viene determinato il segmento che si trova attualmente nel ribosoma codone (tripletto), interagisce in modo del tutto specifico con una struttura ad esso adatta tripletta (anticodone) nell'RNA di trasferimento che ha portato l'amminoacido nel ribosoma.

Il RNA di trasferimento con il suo amminoacido si avvicina a un codone certo di mRNA e si collega con lui; al successivo sito vicino di i-RNA unisce un altro tRNA con un amminoacido diverso e così via finché non viene letta l'intera catena dell'i-RNA, finché tutti gli amminoacidi non vengono disposti nell'ordine appropriato, formando una molecola proteica. E il t-RNA, che trasporta l'amminoacido in un sito specifico della catena polipeptidica, liberato dal suo amminoacido ed esce dal ribosoma.

Poi di nuovo nel citoplasma, l'amminoacido desiderato può unirsi ad esso e lo trasferirà nuovamente al ribosoma. Nel processo di sintesi proteica, non sono coinvolti contemporaneamente non uno, ma diversi ribosomi, i poliribosomi.

Le fasi principali del trasferimento di informazioni genetiche:

1. Sintesi sul DNA come su un modello di mRNA (trascrizione)
2. Sintesi della catena polipeptidica nei ribosomi secondo il programma contenuto nell'i-RNA (traduzione) .

Le fasi sono universali per tutti gli esseri viventi, ma le relazioni temporali e spaziali di questi processi differiscono nei pro- e negli eucarioti.

A procarioti la trascrizione e la traduzione possono avvenire simultaneamente perché il DNA si trova nel citoplasma. A eucariote trascrizione e traduzione sono strettamente separate nello spazio e nel tempo: nel nucleo avviene la sintesi dei vari RNA, dopodiché le molecole di RNA devono lasciare il nucleo, passando attraverso la membrana nucleare. L'RNA viene poi trasportato nel citoplasma al sito di sintesi proteica.

Lezione 5 Codice genetico

Definizione del concetto

Il codice genetico è un sistema per registrare informazioni sulla sequenza degli amminoacidi nelle proteine ​​utilizzando la sequenza dei nucleotidi nel DNA.

Poiché il DNA non è direttamente coinvolto nella sintesi proteica, il codice è scritto nel linguaggio dell'RNA. L'RNA contiene uracile invece di timina.

Proprietà del codice genetico

1. Triplicità

Ogni amminoacido è codificato da una sequenza di 3 nucleotidi.

Definizione: una tripletta o codone è una sequenza di tre nucleotidi che codifica per un amminoacido.

Il codice non può essere monopleto, poiché 4 (il numero di diversi nucleotidi nel DNA) è inferiore a 20. Il codice non può essere doppietto, perché 16 (il numero di combinazioni e permutazioni di 4 nucleotidi per 2) è inferiore a 20. Il codice può essere tripletta, perché 64 (il numero di combinazioni e permutazioni da 4 a 3) è maggiore di 20.

2. Degenerazione.

Tutti gli aminoacidi, ad eccezione della metionina e del triptofano, sono codificati da più di una tripletta:

2 AK per 1 tripletta = 2.

9 AK x 2 triplette = 18.

1 AK 3 triplette = 3.

5 AK x 4 triplette = 20.

3 AK x 6 triplette = 18.

Un totale di 61 codici tripletta per 20 aminoacidi.

3. La presenza di segni di punteggiatura intergenici.

Definizione:

Gene è un segmento di DNA che codifica per una catena polipeptidica o una molecola tPHK, RRNA osPHK.

GenitPHK, rPHK, sPHKle proteine ​​non codificano.

Alla fine di ciascun gene che codifica per un polipeptide, c'è almeno una delle 3 triplette che codificano i codoni di stop dell'RNA, o segnali di stop. Nell'mRNA assomigliano a questo: UAA, UAG, UGA . Terminano (terminano) la trasmissione.

Convenzionalmente il codone si applica anche ai segni di punteggiatura AGOSTO - il primo dopo la sequenza leader. (Vedi lezione 8) Svolge la funzione di una lettera maiuscola. In questa posizione codifica per la formilmetionina (nei procarioti).

4. Unicità.

Ciascuna tripletta codifica per un solo amminoacido o è un terminatore della traduzione.

L'eccezione è il codone AGOSTO . Nei procarioti, nella prima posizione (lettera maiuscola) codifica la formilmetionina, in ogni altra posizione codifica la metionina.

5. Compattezza o assenza di segni di punteggiatura intragenici.
All'interno di un gene, ciascun nucleotide fa parte di un codone significativo.

Nel 1961, Seymour Benzer e Francis Crick dimostrarono sperimentalmente che il codice è tripletto e compatto.

L'essenza dell'esperimento: mutazione "+" - l'inserimento di un nucleotide. Mutazione "-" - perdita di un nucleotide. Una singola mutazione "+" o "-" all'inizio di un gene corrompe l'intero gene. Anche una doppia mutazione "+" o "-" rovina l'intero gene.

Una tripla mutazione "+" o "-" all'inizio del gene ne rovina solo una parte. Una mutazione quadrupla "+" o "-" rovina nuovamente l'intero gene.

L'esperimento lo dimostra il codice è tripletto e non ci sono segni di punteggiatura all'interno del gene. L'esperimento è stato condotto su due geni fagici adiacenti e ha mostrato, inoltre, la presenza di segni di punteggiatura tra i geni.

6. Versatilità.

Il codice genetico è lo stesso per tutte le creature che vivono sulla Terra.

Nel 1979 Burrell aprì ideale codice mitocondriale umano.

Definizione:

“Ideale” è il codice genetico in cui è soddisfatta la regola di degenerazione del codice quasi-doppietto: se i primi due nucleotidi in due triplette coincidono e il terzo nucleotide appartiene alla stessa classe (entrambi sono purine o entrambi sono pirimidine) , allora queste triplette codificano per lo stesso amminoacido .

Esistono due eccezioni a questa regola nel codice generico. Entrambe le deviazioni dal codice ideale nell'universale si riferiscono ai punti fondamentali: l'inizio e la fine della sintesi proteica:

codone

universale

codice

Codici mitocondriali

Vertebrati

Invertebrati

Lievito

Impianti

FERMARE

FERMARE

Con l'UA

AGA A

FERMARE

FERMARE

230 sostituzioni non cambiano la classe dell'amminoacido codificato. alla lacerabilità.

Nel 1956 Georgy Gamov propose una variante del codice sovrapposto. Secondo il codice Gamow ogni nucleotide, a partire dal terzo nel gene, fa parte di 3 codoni. Quando il codice genetico fu decifrato, si scoprì che non si sovrapponeva, cioè ogni nucleotide fa parte di un solo codone.

Vantaggi del codice genetico sovrapposto: compattezza, minore dipendenza della struttura proteica dall'inserimento o dalla delezione di un nucleotide.

Svantaggio: elevata dipendenza della struttura proteica dalla sostituzione nucleotidica e restrizione sui vicini.

Nel 1976 fu sequenziato il DNA del fago φX174. Ha un DNA circolare a filamento singolo di 5375 nucleotidi. Era noto che il fago codificava 9 proteine. Per 6 di essi sono stati identificati i geni situati uno dopo l'altro.

Si è scoperto che c'è una sovrapposizione. Il gene E è completamente all'interno del gene D . Il suo codone di inizio appare come risultato di uno spostamento di un nucleotide nella lettura. Gene J inizia dove finisce il gene D . Codone di inizio gene J si sovrappone al codone di terminazione del gene D dovuto allo spostamento di due nucleotidi. Il disegno è chiamato "reading frame shift" da un numero di nucleotidi che non è multiplo di tre. Ad oggi, la sovrapposizione è stata dimostrata solo per pochi fagi.

Capacità informativa del DNA

Ci sono 6 miliardi di persone sulla Terra. Informazioni ereditarie su di loro
racchiuso in 6x10 9 spermatozoi. Secondo varie stime, una persona ne ha dai 30 ai 50
mille geni. Tutti gli esseri umani hanno circa 30x10 13 geni, o 30x10 16 paia di basi, che costituiscono 10 17 codoni. La pagina media di un libro contiene 25x10 2 caratteri. Il DNA di 6x10 9 spermatozoi contiene informazioni pari in volume a circa

4x10 13 pagine di libro. Queste pagine occuperebbero il volume di 6 edifici NSU. 6x10 9 spermatozoi occupano la metà di un ditale. Il loro DNA occupa meno di un quarto di ditale.

CODICE GENETICO(greco, genetikos riferito all'origine; sin.: codice, codice biologico, codice aminoacido, codice proteina, codice acido nucleico) - un sistema per registrare informazioni ereditarie nelle molecole di acido nucleico di animali, piante, batteri e virus alternando la sequenza di nucleotidi.

Le informazioni genetiche (Fig.) da cellula a cellula, di generazione in generazione, ad eccezione dei virus contenenti RNA, vengono trasmesse mediante la duplicazione delle molecole di DNA (vedi Replicazione). L'implementazione delle informazioni ereditarie del DNA nel corso della vita cellulare avviene attraverso 3 tipi di RNA: informativo (mRNA o mRNA), ribosomiale (rRNA) e di trasporto (tRNA), che vengono sintetizzati sul DNA come su una matrice con l'aiuto dell'enzima RNA polimerasi. Allo stesso tempo, la sequenza dei nucleotidi in una molecola di DNA determina in modo univoco la sequenza dei nucleotidi in tutti e tre i tipi di RNA (vedi Trascrizione). L'informazione di un gene (vedi) che codifica per una molecola proteica è trasportata solo dall'mRNA. Il prodotto finale dell'implementazione delle informazioni ereditarie è la sintesi di molecole proteiche, la cui specificità è determinata dalla sequenza dei loro aminoacidi (vedi Traduzione).

Poiché nel DNA o nell'RNA sono presenti solo 4 diverse basi azotate [nel DNA: adenina (A), timina (T), guanina (G), citosina (C); nell'RNA - adenina (A), uracile (U), citosina (C), guanina (G)], la cui sequenza determina la sequenza di 20 aminoacidi nella proteina, il problema di G. a., cioè il problema di tradurre un alfabeto di 4 lettere di acidi nucleici nell'alfabeto di 20 lettere di polipeptidi.

Per la prima volta, l'idea della sintesi matriciale di molecole proteiche con la corretta previsione delle proprietà di un'ipotetica matrice fu formulata da N.K. Koltsov nel 1928. Nel 1944, Avery e altri stabilirono che le molecole di DNA sono responsabili del trasferimento dei caratteri ereditari durante la trasformazione in pneumococchi. Nel 1948, E. Chargaff dimostrò che in tutte le molecole di DNA esiste un'uguaglianza quantitativa dei nucleotidi corrispondenti (A-T, G-C). Nel 1953, F. Crick, J. Watson e Wilkins (M. H. F. Wilkins), sulla base di questa regola e dei dati dell'analisi di diffrazione dei raggi X (vedi), giunsero alla conclusione che una molecola di DNA è una doppia elica, costituita da due polinucleotidi filamenti legati tra loro da legami idrogeno. Inoltre, solo T può essere posizionato contro A di una catena nella seconda e solo C contro G. Questa complementarità porta al fatto che la sequenza nucleotidica di una catena determina in modo univoco la sequenza dell'altra. La seconda conclusione significativa che deriva da questo modello è che la molecola del DNA è capace di autoriprodursi.

Nel 1954 G. Gamow formulò il problema di G. nella sua forma moderna. Nel 1957 F. Crick espresse l'ipotesi dell'adattatore, assumendo che gli amminoacidi interagiscano con l'acido nucleico non direttamente, ma attraverso intermediari (ora noti come tRNA). Negli anni successivi tutti i principali anelli dello schema generale di trasmissione dell'informazione genetica, inizialmente ipotetici, furono confermati sperimentalmente. Nel 1957 furono scoperti gli mRNA [A. S. Spirin, A. N. Belozersky et al.; Folkin e Astrakhan (E. Volkin, L. Astrachan)] e tRNA [Hoagland (M. V. Hoagland)]; nel 1960, il DNA fu sintetizzato all'esterno della cellula utilizzando macromolecole di DNA esistenti come modello (A. Kornberg) e fu scoperta la sintesi dell'RNA dipendente dal DNA [Weiss (S. V. Weiss) et al.]. Nel 1961 fu creato un sistema privo di cellule, in cui, in presenza di RNA naturale o poliribonucleotidi sintetici, furono sintetizzate sostanze simili alle proteine ​​[M. Nirenberg e Matthaei (JH Matthaei)]. Il problema della cognizione di G. a. consisteva nello studio delle proprietà generali del codice e nella decifrazione effettiva, cioè nello scoprire quali combinazioni di nucleotidi (codoni) codificano determinati amminoacidi.

Le proprietà generali del codice sono state chiarite indipendentemente dalla sua decodificazione e soprattutto prima di essa analizzando i modelli molecolari della formazione delle mutazioni (F. Crick et al., 1961; N. V. Luchnik, 1963). Si riducono a questo:

1. Il codice è universale, cioè identico, almeno nella sua sostanza, per tutti gli esseri viventi.

2. Il codice è tripletta, cioè ogni amminoacido è codificato da una tripla di nucleotidi.

3. Il codice non è sovrapposto, cioè un dato nucleotide non può far parte di più di un codone.

4. Il codice è degenere, cioè un amminoacido può essere codificato da più triplette.

5. Le informazioni sulla struttura primaria della proteina vengono lette dall'mRNA in sequenza, a partire da un punto fisso.

6. La maggior parte delle possibili triplette hanno "significato", cioè codificano amminoacidi.

7. Delle tre "lettere" del codone, solo due (obbligate) sono di primaria importanza, mentre la terza (facoltativa) porta molte meno informazioni.

La decodifica diretta del codice consisterebbe nel confrontare la sequenza nucleotidica del gene strutturale (o l'mRNA sintetizzato su di esso) con la sequenza aminoacidica della proteina corrispondente. Tuttavia, in questo modo è ancora tecnicamente impossibile. Sono stati utilizzati altri due modi: sintesi proteica in un sistema privo di cellule utilizzando poliribonucleotidi artificiali di composizione nota come matrice e analisi dei modelli molecolari di formazione delle mutazioni (vedi). Il primo ha portato risultati positivi in ​​precedenza e storicamente ha svolto un ruolo importante nella decifrazione di G. to.

Nel 1961, M. Nirenberg e Mattei usarono come matrice un omopolimero - un acido poliuridilico sintetico (cioè RNA artificiale della composizione UUUU ...) e ricevettero polifenilalanina. Da ciò ne consegue che il codone della fenilalanina è costituito da più U, cioè nel caso di un codice tripletta sta per UUU. Successivamente, insieme agli omopolimeri, furono utilizzati i poliribonucleotidi costituiti da diversi nucleotidi. In questo caso era nota solo la composizione dei polimeri, mentre la disposizione dei nucleotidi in essi era statistica, e quindi l'analisi dei risultati era statistica e dava conclusioni indirette. Abbastanza rapidamente, siamo riusciti a trovare almeno una tripletta per tutti i 20 aminoacidi. Si è scoperto che la presenza di solventi organici, cambiamenti di pH o temperatura, alcuni cationi e soprattutto antibiotici rendono il codice ambiguo: gli stessi codoni iniziano a stimolare l'inclusione di altri aminoacidi, in alcuni casi un codone inizia a codificarne fino a quattro amminoacidi diversi. La streptomicina ha influenzato la lettura delle informazioni sia nei sistemi privi di cellule che in vivo ed è risultata efficace solo su ceppi batterici sensibili alla streptomicina. Nei ceppi streptomicina-dipendenti, ha "corretto" la lettura dei codoni che erano cambiati a causa della mutazione. Risultati simili hanno dato motivo di dubitare della correttezza della decodifica di G. con l'aiuto di un sistema privo di cellule; era necessaria la conferma e principalmente tramite dati in vivo.

I principali dati sul G.a. in vivo sono stati ottenuti analizzando la composizione aminoacidica delle proteine ​​in organismi trattati con agenti mutageni (vedi) con un meccanismo d'azione noto, ad esempio azotato-one, che provoca la sostituzione di C con U e A da D. Informazioni utili sono fornite anche dall'analisi delle mutazioni causate da mutageni non specifici, dal confronto delle differenze nella struttura primaria delle proteine ​​correlate in diverse specie, dalla correlazione tra la composizione del DNA e delle proteine, ecc.

La decodifica di G. sulla base di dati in vivo e in vitro ha dato risultati coincidenti. Successivamente furono sviluppati altri tre metodi per decifrare il codice in sistemi privi di cellule: legame dell'aminoacil-tRNA (cioè tRNA con un amminoacido attivato attaccato) con trinucleotidi di composizione nota (M. Nirenberg et al., 1965), legame dell'amminoacil-tRNA con polinucleotidi a partire da una certa tripletta (Mattei et al., 1966), e l'uso di polimeri come mRNA, di cui è nota non solo la composizione, ma anche l'ordine dei nucleotidi (X. Korana et al ., 1965). Tutti e tre i metodi si completano a vicenda e i risultati sono coerenti con i dati ottenuti negli esperimenti in vivo.

Negli anni '70. 20 ° secolo c'erano metodi di controllo particolarmente affidabile dei risultati della decodifica di G. A. È noto che le mutazioni che si verificano sotto l'influenza di proflavina consistono nella perdita o nell'inserimento di nucleotidi separati che portano allo spostamento del quadro di lettura. Nel fago T4 la proflavina ha indotto una serie di mutazioni nelle quali è cambiata la composizione del lisozima. Questa composizione è stata analizzata e confrontata con quei codoni che avrebbero dovuto essere ottenuti mediante uno spostamento della cornice di lettura. C'è stata una partita completa. Inoltre, questo metodo ha permesso di stabilire quali triplette del codice degenerato codificano ciascuno degli amminoacidi. Nel 1970, Adams (J. M. Adams) e i suoi collaboratori riuscirono a decifrare parzialmente G. a. con un metodo diretto: nel fago R17, la sequenza di basi fu determinata in un frammento di 57 nucleotidi di lunghezza e confrontata con la sequenza aminoacidica di le sue proteine ​​del guscio. I risultati erano in completo accordo con quelli ottenuti con metodi meno diretti. Pertanto, il codice viene decifrato completamente e correttamente.

I risultati della decodifica sono riepilogati in una tabella. Elenca la composizione dei codoni e dell'RNA. La composizione degli anticodoni del tRNA è complementare ai codoni dell'mRNA, cioè al posto di U contengono A, invece di A - U, invece di C - G e invece di G - C, e corrisponde ai codoni del gene strutturale (quel filamento di DNA, con cui si leggono le informazioni) con l'unica differenza che l'uracile prende il posto della timina. Delle 64 triplette che possono essere formate da una combinazione di 4 nucleotidi, 61 hanno "senso", cioè codificano amminoacidi, e 3 sono "non senso" (prive di significato). Esiste una relazione abbastanza chiara tra la composizione delle terzine e il loro significato, che è stata scoperta anche analizzando le proprietà generali del codice. In alcuni casi, le triplette che codificano per uno specifico amminoacido (ad esempio, prolina, alanina) sono caratterizzate dal fatto che i primi due nucleotidi (obbligati) sono uguali e il terzo (opzionale) può essere qualsiasi cosa. In altri casi (quando si codifica, ad esempio, asparagina, glutammina), due triplette simili hanno lo stesso significato, in cui i primi due nucleotidi coincidono e qualsiasi purina o pirimidina prende il posto della terza.

Codoni senza senso, 2 dei quali hanno nomi speciali corrispondenti alla designazione dei mutanti fagici (UAA-ocra, UAG-ambra, UGA-opale), sebbene non codifichino alcun amminoacido, sono di grande importanza durante la lettura delle informazioni, codificando il estremità della catena polipeptidica.

Le informazioni vengono lette nella direzione da 5 1 -> 3 1 - alla fine della catena nucleotidica (vedi acidi desossiribonucleici). In questo caso, la sintesi proteica procede da un amminoacido con un gruppo amminico libero ad un amminoacido con un gruppo carbossilico libero. L'inizio della sintesi è codificato dalle triplette AUG e GUG, che in questo caso includono uno specifico amminoacil-tRNA di partenza, vale a dire N-formilmetionil-tRNA. Le stesse triplette, quando localizzate all'interno della catena, codificano rispettivamente metionina e valina. L'ambiguità è rimossa dal fatto che l'inizio della lettura è preceduto da un'assurdità. Esistono prove che il confine tra regioni di mRNA che codificano per proteine ​​diverse è costituito da più di due triplette e che la struttura secondaria dell'RNA cambia in questi punti; questo problema è in fase di indagine. Se all'interno di un gene strutturale si trova un codone senza senso, la proteina corrispondente viene costruita solo fino alla posizione di questo codone.

La scoperta e la decodifica del codice genetico - un risultato eccezionale della biologia molecolare - ha avuto un impatto su tutte le scienze biologiche, gettando in alcuni casi le basi per lo sviluppo di sezioni speciali di grandi dimensioni (vedi Genetica molecolare). L'effetto di apertura di G. e le ricerche ad esso collegate sono paragonabili all'effetto che fu ottenuto sulle scienze biologiche dalla teoria di Darwin.

L'universalità di G. a. è una prova diretta dell'universalità dei meccanismi molecolari fondamentali della vita in tutti i rappresentanti del mondo organico. Nel frattempo, le grandi differenze nelle funzioni dell'apparato genetico e nella sua struttura durante la transizione dai procarioti agli eucarioti e da quelli unicellulari a quelli multicellulari sono probabilmente associate a differenze molecolari, il cui studio è uno dei compiti del futuro. Poiché la ricerca di G. è solo questione degli ultimi anni, l'importanza dei risultati ottenuti per la medicina pratica è solo di natura indiretta, consentendo per il momento di comprendere la natura delle malattie, il meccanismo d'azione degli agenti patogeni e sostanze medicinali. Tuttavia, la scoperta di fenomeni come trasformazione (vedi), trasduzione (vedi), soppressione (vedi), indica la possibilità fondamentale di correggere le informazioni ereditarie patologicamente alterate o la loro correzione - la cosiddetta. ingegneria genetica (vedi).

Tavolo. CODICE GENETICO

Primo nucleotide del codone

Secondo nucleotide del codone

Terzo, nucleotide del codone

Fenilalanina

J Sciocchezze

triptofano

Istidina

Acido glutammico

Isoleucina

Aspartico

Metionina

Asparagina

Glutammina

* Codifica la fine della catena.

** Codifica anche l'inizio della catena.

Bibliografia: Ichas M. Codice biologico, trad. dall'inglese, M., 1971; Arciere N.B. Biofisica delle sconfitte citogenetiche e un codice genetico, L., 1968; Genetica molecolare, trad. dall'inglese, ed. A. N. Belozersky, parte 1, M., 1964; Acidi nucleici, trans. dall'inglese, ed. A. N. Belozersky, Mosca, 1965. Watson JD Biologia molecolare del gene, trad. dall'inglese, M., 1967; Genetica fisiologica, ed. M. E. Lobasheva S. G., Inge-Vechtoma-va, L., 1976, bibliogr.; Desossiribonucleine&ure, Schlttssel des Lebens, hrsg. v „E. Geissler, B., 1972; Il codice genetico, Gold Spr. Harb. Sintomo quantitativo Biol., v. 31, 1966; W o e s e C. R. Il codice genetico, N. Y. a. o., 1967.

Il codice genetico è un sistema per registrare informazioni ereditarie nelle molecole di acido nucleico, basato su una certa alternanza di sequenze nucleotidiche nel DNA o RNA che formano codoni corrispondenti agli amminoacidi in una proteina.

Proprietà del codice genetico.

Il codice genetico ha diverse proprietà.

    Triplicità.

    Degenerazione o ridondanza.

    Inequivocabilità.

    Polarità.

    Non sovrapponibile.

    Compattezza.

    Versatilità.

Va notato che alcuni autori offrono anche altre proprietà del codice legate alle caratteristiche chimiche dei nucleotidi inclusi nel codice o alla frequenza di presenza dei singoli aminoacidi nelle proteine ​​del corpo, ecc. Tuttavia, queste proprietà derivano da quanto sopra, quindi le considereremo lì.

UN. Triplicità. Il codice genetico, come molti sistemi organizzati in modo complesso, ha la più piccola unità strutturale e funzionale. Una tripletta è la più piccola unità strutturale del codice genetico. È costituito da tre nucleotidi. Un codone è la più piccola unità funzionale del codice genetico. Di norma, le triplette di mRNA sono chiamate codoni. Nel codice genetico, un codone svolge diverse funzioni. Innanzitutto, la sua funzione principale è quella di codificare un amminoacido. In secondo luogo, un codone potrebbe non codificare per un amminoacido, ma in questo caso ha una funzione diversa (vedi sotto). Come si può vedere dalla definizione, una terzina è un concetto che caratterizza elementare unità strutturale codice genetico (tre nucleotidi). il codone caratterizza unità semantica elementare genoma: tre nucleotidi determinano l'attaccamento alla catena polipeptidica di un amminoacido.

L'unità strutturale elementare è stata prima decifrata teoricamente e poi la sua esistenza è stata confermata sperimentalmente. Infatti, 20 aminoacidi non possono essere codificati da uno o due nucleotidi. questi ultimi sono solo 4. Tre nucleotidi su quattro danno 4 3 = 64 varianti, che coprono più che il numero di amminoacidi presenti negli organismi viventi (vedi Tabella 1).

Le combinazioni di nucleotidi presentate nella Tabella 64 hanno due caratteristiche. Innanzitutto, delle 64 varianti di triplette, solo 61 sono codoni e codificano qualsiasi amminoacido, sono chiamati codoni di senso. Tre triplette non codificano

gli amminoacidi a sono segnali di stop che segnano la fine della traduzione. Ci sono tre di queste terzine UAA, UAG, UGA, sono anche chiamati "privi di significato" (codoni senza senso). Come risultato di una mutazione, che è associata alla sostituzione di un nucleotide in una tripletta con un altro, da un codone di senso può derivare un codone senza significato. Questo tipo di mutazione si chiama mutazione senza senso. Se un tale segnale di arresto si forma all'interno del gene (nella sua parte informativa), durante la sintesi proteica in questo luogo il processo verrà costantemente interrotto: verrà sintetizzata solo la prima parte (prima del segnale di arresto) della proteina. Una persona con tale patologia sperimenterà una mancanza di proteine ​​e avvertirà i sintomi associati a questa mancanza. Ad esempio, questo tipo di mutazione è stata trovata nel gene che codifica per la catena beta dell'emoglobina. Viene sintetizzata una catena di emoglobina inattiva accorciata, che viene rapidamente distrutta. Di conseguenza, si forma una molecola di emoglobina priva di catena beta. È chiaro che è improbabile che una tale molecola adempia pienamente ai suoi compiti. Esiste una malattia grave che si sviluppa in base al tipo di anemia emolitica (talassemia beta-zero, dalla parola greca "Talas" - Mar Mediterraneo, dove questa malattia è stata scoperta per la prima volta).

Il meccanismo d'azione dei codoni di stop è diverso dal meccanismo d'azione dei codoni di senso. Ciò deriva dal fatto che per tutti i codoni che codificano gli amminoacidi sono stati trovati i corrispondenti tRNA. Non è stato trovato tRNA per codoni senza senso. Pertanto, il tRNA non prende parte al processo di arresto della sintesi proteica.

codoneAGOSTO (a volte GUG nei batteri) non solo codifica l'amminoacido metionina e valina, ma è ancheiniziatore della trasmissione .

B. Degenerazione o ridondanza.

61 delle 64 triplette codificano per 20 aminoacidi. Un tale eccesso di tre volte nel numero di triplette rispetto al numero di amminoacidi suggerisce che nel trasferimento delle informazioni possono essere utilizzate due opzioni di codifica. In primo luogo, non tutti i 64 codoni possono essere coinvolti nella codifica di 20 aminoacidi, ma solo 20 e, in secondo luogo, gli aminoacidi possono essere codificati da diversi codoni. Gli studi hanno dimostrato che la natura ha utilizzato quest’ultima opzione.

La sua preferenza è chiara. Se solo 20 delle 64 varianti di triplette fossero coinvolte nella codifica degli amminoacidi, allora 44 triplette (su 64) rimarrebbero non codificanti, cioè privi di significato (codoni senza senso). In precedenza, abbiamo sottolineato quanto sia pericolosa per la vita della cellula la trasformazione della tripletta codificante a seguito della mutazione in un codone senza senso: ciò interrompe in modo significativo il normale funzionamento della RNA polimerasi, portando infine allo sviluppo di malattie. Attualmente ci sono tre codoni senza senso nel nostro genoma, e ora immaginiamo cosa accadrebbe se il numero di codoni senza senso aumentasse di circa 15 volte. È chiaro che in una situazione del genere la transizione dai codoni normali ai codoni senza senso sarà incommensurabilmente più alta.

Un codice in cui un amminoacido è codificato da più triplette è detto degenerato o ridondante. Quasi ogni amminoacido ha diversi codoni. Quindi, l'amminoacido leucina può essere codificato da sei triplette: UUA, UUG, CUU, CUC, CUA, CUG. La valina è codificata da quattro triplette, la fenilalanina da due e sole triptofano e metionina codificato da un codone. Viene chiamata la proprietà associata alla registrazione delle stesse informazioni con caratteri diversi degenerazione.

Il numero di codoni assegnati a un amminoacido è ben correlato alla frequenza con cui l'amminoacido si presenta nelle proteine.

E questo molto probabilmente non è casuale. Maggiore è la frequenza di presenza di un amminoacido in una proteina, più spesso il codone di questo amminoacido è presente nel genoma, maggiore è la probabilità del suo danno da parte di fattori mutageni. Pertanto, è chiaro che un codone mutato ha maggiori probabilità di codificare per lo stesso amminoacido se è altamente degenerato. Da queste posizioni, la degenerazione del codice genetico è un meccanismo che protegge il genoma umano dai danni.

Va notato che il termine degenerazione viene utilizzato in genetica molecolare anche in un altro senso. Poiché la maggior parte dell'informazione nel codone ricade sui primi due nucleotidi, la base nella terza posizione del codone risulta essere di scarsa importanza. Questo fenomeno è chiamato “degenerazione della terza base”. Quest'ultima caratteristica minimizza l'effetto delle mutazioni. Ad esempio, è noto che la funzione principale dei globuli rossi è il trasporto dell'ossigeno dai polmoni ai tessuti e dell'anidride carbonica dai tessuti ai polmoni. Questa funzione è svolta dal pigmento respiratorio: l'emoglobina, che riempie l'intero citoplasma dell'eritrocita. Consiste in una parte proteica: la globina, codificata dal gene corrispondente. Oltre alle proteine, l’emoglobina contiene l’eme, che contiene ferro. Le mutazioni nei geni globinici portano alla comparsa di diverse varianti di emoglobine. Molto spesso sono associate mutazioni sostituzione di un nucleotide con un altro e comparsa di un nuovo codone nel gene, che può codificare per un nuovo amminoacido nella catena polipeptidica dell'emoglobina. In una tripletta, a seguito di una mutazione, è possibile sostituire qualsiasi nucleotide: il primo, il secondo o il terzo. È noto che diverse centinaia di mutazioni influenzano l'integrità dei geni globinici. Vicino 400 di cui sono associati alla sostituzione di singoli nucleotidi nel gene e alla corrispondente sostituzione di amminoacidi nel polipeptide. Di questi, solo 100 le sostituzioni portano all'instabilità dell'emoglobina e a vari tipi di malattie da lievi a molto gravi. 300 (circa il 64%) mutazioni di sostituzione non influenzano la funzione dell'emoglobina e non portano a patologie. Uno dei motivi di ciò è la “degenerazione della terza base” menzionata sopra, quando la sostituzione del terzo nucleotide nella tripletta che codifica serina, leucina, prolina, arginina e alcuni altri amminoacidi porta alla comparsa di un codone sinonimo codificanti lo stesso amminoacido. Fenotipicamente, tale mutazione non si manifesterà. Al contrario, qualsiasi sostituzione del primo o del secondo nucleotide in una tripletta porta nel 100% dei casi alla comparsa di una nuova variante dell'emoglobina. Ma anche in questo caso potrebbero non esserci gravi disturbi fenotipici. La ragione di ciò è la sostituzione di un amminoacido nell'emoglobina con un altro simile al primo in termini di proprietà fisico-chimiche. Ad esempio, se un amminoacido con proprietà idrofile viene sostituito da un altro amminoacido, ma con le stesse proprietà.

L'emoglobina è costituita da un gruppo porfirinico di ferro dell'eme (ad esso sono attaccate molecole di ossigeno e anidride carbonica) e da una proteina: la globina. L'emoglobina adulta (HbA1c) ne contiene due identici- catene e due-Catene. Molecola-la catena contiene 141 residui di aminoacidi,- catena - 146,- E-le catene differiscono per molti residui amminoacidici. La sequenza aminoacidica di ciascuna catena globinica è codificata dal proprio gene. La codifica del gene- la catena si trova sul braccio corto del cromosoma 16,-gene - nel braccio corto del cromosoma 11. Cambiamento nella codifica del gene- La catena dell'emoglobina del primo o del secondo nucleotide porta quasi sempre alla comparsa di nuovi aminoacidi nella proteina, all'interruzione delle funzioni dell'emoglobina e a gravi conseguenze per il paziente. Ad esempio, la sostituzione della "C" in una delle triplette CAU (istidina) con la "U" porterà alla comparsa di una nuova tripletta UAU che codifica per un altro amminoacido, la tirosina, e fenotipicamente si manifesterà in una malattia grave. sostituzione simile nella posizione 63La catena del polipeptide istidina-tirosina destabilizzerà l'emoglobina. Si sviluppa la malattia metaemoglobinemia. Cambiamento, come risultato della mutazione, dell'acido glutammico in valina in 6a posizionecatena è la causa di una grave malattia: l'anemia falciforme. Non continuiamo la triste lista. Notiamo solo che quando si sostituiscono i primi due nucleotidi, un amminoacido può apparire simile nelle proprietà fisico-chimiche al precedente. Pertanto, la sostituzione del 2° nucleotide in una delle triplette che codificano l'acido glutammico (GAA) inLa catena su “Y” porta alla comparsa di una nuova tripletta (GUA) che codifica per la valina, e la sostituzione del primo nucleotide con “A” forma una tripletta AAA che codifica per l’amminoacido lisina. L'acido glutammico e la lisina hanno proprietà fisico-chimiche simili: sono entrambi idrofili. La valina è un amminoacido idrofobico. Pertanto, la sostituzione dell'acido glutammico idrofilo con valina idrofobica modifica significativamente le proprietà dell'emoglobina, che alla fine porta allo sviluppo dell'anemia falciforme, mentre la sostituzione dell'acido glutammico idrofilo con lisina idrofila modifica in misura minore la funzione dell'emoglobina - pazienti sviluppare una forma lieve di anemia. Come risultato della sostituzione della terza base, la nuova tripletta può codificare gli stessi aminoacidi della precedente. Ad esempio, se l'uracile è stato sostituito dalla citosina nella tripletta CAH e si è formata una tripletta CAC, praticamente non verrà rilevato alcun cambiamento fenotipico in una persona. Questo è comprensibile, perché Entrambe le triplette codificano per lo stesso amminoacido, l'istidina.

In conclusione, è opportuno sottolineare che la degenerazione del codice genetico e la degenerazione della terza base dal punto di vista biologico generale sono meccanismi protettivi incorporati nell'evoluzione nella struttura unica del DNA e dell'RNA.

V. Inequivocabilità.

Ciascuna tripletta (ad eccezione di quelle prive di significato) codifica solo un amminoacido. Pertanto, nella direzione del codone - amminoacido, il codice genetico non è ambiguo, nella direzione dell'amminoacido - codone - è ambiguo (degenerato).

inequivocabile

amminoacido del codone

degenerare

E in questo caso, la necessità di univocità nel codice genetico è ovvia. In un'altra variante, durante la traduzione dello stesso codone, nella catena proteica verrebbero inseriti amminoacidi diversi e, di conseguenza, si formerebbero proteine ​​con strutture primarie e funzioni diverse. Il metabolismo della cellula passerebbe alla modalità operativa "un gene - diversi polipeptidi". È chiaro che in una situazione del genere la funzione regolatrice dei geni verrebbe completamente persa.

g. Polarità

La lettura delle informazioni dal DNA e dall'mRNA avviene solo in una direzione. La polarità è essenziale per definire strutture di ordine superiore (secondaria, terziaria, ecc.). In precedenza abbiamo parlato del fatto che le strutture di ordine inferiore determinano strutture di ordine superiore. La struttura terziaria e le strutture di ordine superiore nelle proteine ​​si formano immediatamente non appena la catena di RNA sintetizzata si allontana dalla molecola di DNA o la catena polipeptidica si allontana dal ribosoma. Mentre l'estremità libera dell'RNA o del polipeptide acquisisce una struttura terziaria, l'altra estremità della catena continua ancora ad essere sintetizzata sul DNA (se viene trascritto l'RNA) o sul ribosoma (se viene trascritto il polipeptide).

Pertanto, il processo unidirezionale di lettura delle informazioni (nella sintesi di RNA e proteine) è essenziale non solo per determinare la sequenza di nucleotidi o amminoacidi nella sostanza sintetizzata, ma per la rigida determinazione di secondario, terziario, ecc. strutture.

e. Non sovrapposti.

Il codice può sovrapporsi o meno. Nella maggior parte degli organismi, il codice non si sovrappone. In alcuni fagi è stato trovato un codice sovrapposto.

L'essenza di un codice non sovrapposto è che il nucleotide di un codone non può essere contemporaneamente il nucleotide di un altro codone. Se il codice fosse sovrapposto, allora la sequenza di sette nucleotidi (GCUGCUG) potrebbe codificare non due aminoacidi (alanina-alanina) (Fig. 33, A) come nel caso di un codice non sovrapposto, ma tre (se un nucleotide è comune) (Fig. 33, B) o cinque (se due nucleotidi sono comuni) (vedere Fig. 33, C). Negli ultimi due casi, una mutazione di qualsiasi nucleotide porterebbe ad una violazione nella sequenza di due, tre, ecc. aminoacidi.

Tuttavia, si è scoperto che una mutazione di un nucleotide interrompe sempre l'inclusione di un amminoacido in un polipeptide. Questo è un argomento significativo a favore del fatto che il codice non si sovrappone.

Spieghiamolo nella Figura 34. Le linee in grassetto mostrano triplette che codificano amminoacidi nel caso di codice non sovrapposto e sovrapposto. Gli esperimenti hanno dimostrato inequivocabilmente che il codice genetico non si sovrappone. Senza entrare nei dettagli dell'esperimento, notiamo che se sostituiamo il terzo nucleotide nella sequenza nucleotidica (vedi Fig. 34)A (contrassegnato con un asterisco) a qualcun altro quindi:

1. Con un codice non sovrapposto, la proteina controllata da questa sequenza avrebbe un sostituto per un (primo) amminoacido (contrassegnato con asterischi).

2. Con un codice sovrapposto nell'opzione A, si verificherebbe una sostituzione in due (primo e secondo) aminoacidi (contrassegnati con asterischi). Nell'opzione B, la sostituzione riguarderebbe tre amminoacidi (contrassegnati con asterischi).

Tuttavia, numerosi esperimenti hanno dimostrato che quando un nucleotide nel DNA viene rotto, la proteina colpisce sempre solo un amminoacido, cosa tipica di un codice non sovrapposto.

ГЦУГЦУГ ГЦУГЦУГ ГЦУГЦУГ

HCC HCC HCC UHC CUG HCC CUG UGC HCC CUG

*** *** *** *** *** ***

Alanina - Alanina Ala - Cys - Lei Ala - Lei - Lei - Ala - Lei

A B C

codice non sovrapposto codice sovrapposto

Riso. 34. Schema che spiega la presenza di un codice non sovrapposto nel genoma (spiegazione nel testo).

La non sovrapposizione del codice genetico è associata ad un'altra proprietà - la lettura delle informazioni inizia da un certo punto - il segnale di inizio. Tale segnale di inizio nell'mRNA è il codone che codifica la metionina AUG.

Va notato che una persona ha ancora un piccolo numero di geni che si discostano dalla regola generale e si sovrappongono.

e. Compattezza.

Non ci sono segni di punteggiatura tra i codoni. In altre parole, le triplette non sono separate l'una dall'altra, ad esempio, da un nucleotide senza significato. L'assenza di "segni di punteggiatura" nel codice genetico è stata dimostrata mediante esperimenti.

E. Versatilità.

Il codice è lo stesso per tutti gli organismi che vivono sulla Terra. La prova diretta dell'universalità del codice genetico è stata ottenuta confrontando le sequenze di DNA con le corrispondenti sequenze proteiche. Si è scoperto che gli stessi set di valori di codice sono utilizzati in tutti i genomi batterici ed eucariotici. Ci sono eccezioni, ma non molte.

Le prime eccezioni all'universalità del codice genetico sono state riscontrate nei mitocondri di alcune specie animali. Ciò riguardava il codone terminatore UGA, che ha la stessa lettura del codone UGG che codifica per l'amminoacido triptofano. Sono state trovate anche altre deviazioni più rare dall'universalità.

Sistema di codici del DNA.

Il codice genetico del DNA è costituito da 64 triplette di nucleotidi. Queste triplette sono chiamate codoni. Ciascun codone codifica per uno dei 20 aminoacidi utilizzati nella sintesi proteica. Ciò dà una certa ridondanza al codice: la maggior parte degli amminoacidi sono codificati da più di un codone.
Un codone svolge due funzioni correlate: segnala l'inizio della traduzione e codifica l'incorporazione dell'amminoacido metionina (Met) nella catena polipeptidica in crescita. Il sistema di codice del DNA è progettato in modo tale che il codice genetico possa essere espresso come codoni RNA o come codoni DNA. I codoni dell'RNA si trovano nell'RNA (mRNA) e questi codoni sono in grado di leggere le informazioni durante la sintesi dei polipeptidi (un processo chiamato traduzione). Ma ogni molecola di mRNA acquisisce una sequenza nucleotidica in trascrizione dal gene corrispondente.

Tutti gli amminoacidi tranne due (Met e Trp) possono essere codificati da 2 a 6 codoni diversi. Tuttavia, il genoma della maggior parte degli organismi mostra che alcuni codoni sono favoriti rispetto ad altri. Negli esseri umani, ad esempio, l'alanina è codificata dal GCC quattro volte più spesso che dal GCG. Ciò probabilmente indica una maggiore efficienza traduttiva dell'apparato di traduzione (ad esempio, il ribosoma) per alcuni codoni.

Il codice genetico è quasi universale. Gli stessi codoni sono assegnati allo stesso gruppo di aminoacidi e gli stessi segnali di inizio e fine sono sostanzialmente gli stessi negli animali, nelle piante e nei microrganismi. Tuttavia, sono state riscontrate alcune eccezioni. La maggior parte di questi comporta l'assegnazione di uno o due dei tre codoni di stop a un amminoacido.

Il codice genetico è un modo per codificare la sequenza di amminoacidi in una molecola proteica utilizzando la sequenza di nucleotidi in una molecola di acido nucleico. Le proprietà del codice genetico derivano dalle caratteristiche di questa codifica.

Ogni amminoacido di una proteina è associato a tre successivi nucleotidi dell'acido nucleico: tripletta, O codone. Ciascuno dei nucleotidi può contenere una delle quattro basi azotate. Nell'RNA lo è adenina(UN) uracile(U) guanina(G) citosina(C). Combinando in modi diversi le basi azotate (in questo caso i nucleotidi che le contengono), si possono ottenere tante triplette diverse: AAA, GAU, UCC, GCA, AUC, ecc. Il numero totale di combinazioni possibili è 64, cioè 4 3 .

Le proteine ​​degli organismi viventi contengono circa 20 aminoacidi. Se la natura “concepisse” di codificare ciascun amminoacido non con tre, ma con due nucleotidi, allora la varietà di tali coppie non sarebbe sufficiente, poiché ce ne sarebbero solo 16, cioè 4 2 .

Così, la proprietà principale del codice genetico è la sua tripletta. Ogni amminoacido è codificato da una tripletta di nucleotidi.

Poiché ci sono significativamente più triplette diverse possibili rispetto agli amminoacidi utilizzati nelle molecole biologiche, una proprietà come ridondanza codice genetico. Molti amminoacidi iniziarono a essere codificati non da un codone, ma da diversi. Ad esempio, l'amminoacido glicina è codificato da quattro diversi codoni: GGU, GGC, GGA, GGG. Viene anche chiamata ridondanza degenerazione.

La corrispondenza tra amminoacidi e codoni si riflette sotto forma di tabelle. Ad esempio, questi:

In relazione ai nucleotidi, il codice genetico ha la seguente proprietà: unicità(O specificità): ogni codone corrisponde a un solo amminoacido. Ad esempio, il codone GGU può codificare solo per la glicina e nessun altro amminoacido.

Ancora. La ridondanza riguarda il fatto che diverse triplette possono codificare lo stesso amminoacido. Specificità: ogni codone specifico può codificare per un solo amminoacido.

Non ci sono segni di punteggiatura speciali nel codice genetico (ad eccezione dei codoni di stop che indicano la fine della sintesi del polipeptide). La funzione dei segni di punteggiatura è svolta dalle terzine stesse: la fine di una significa che ne inizierà un'altra. Ciò implica le seguenti due proprietà del codice genetico: continuità E non sovrapposte. Per continuità si intende la lettura di terzine immediatamente una dopo l'altra. Non sovrapposto significa che ciascun nucleotide può far parte di una sola tripletta. Quindi il primo nucleotide della tripletta successiva viene sempre dopo il terzo nucleotide della tripletta precedente. Un codone non può iniziare dal secondo o dal terzo nucleotide del codone precedente. In altre parole, il codice non si sovrappone.

Il codice genetico ha la proprietà universalità. È lo stesso per tutti gli organismi sulla Terra, il che indica l'unità dell'origine della vita. Ci sono eccezioni molto rare a questo. Ad esempio, alcune triplette di mitocondri e cloroplasti codificano per aminoacidi diversi da quelli abituali. Ciò potrebbe indicare che agli albori dello sviluppo della vita esistevano variazioni leggermente diverse del codice genetico.

Infine, il codice genetico ha immunità al rumore, che è una conseguenza della sua proprietà di ridondanza. Le mutazioni puntiformi, che a volte si verificano nel DNA, di solito comportano la sostituzione di una base azotata con un'altra. Questo cambia la tripletta. Ad esempio, era AAA, dopo la mutazione è diventato AAG. Tuttavia, tali cambiamenti non portano sempre a un cambiamento nell'amminoacido nel polipeptide sintetizzato, poiché entrambe le triplette, a causa della proprietà della ridondanza del codice genetico, possono corrispondere a un amminoacido. Dato che le mutazioni sono più spesso dannose, la proprietà di immunità al rumore è utile.