Właściwości kodu genetycznego obejmują. Kod w kodzie: drugi kod genetyczny ujawniony

W metabolizmie organizmu Wiodącą rolę należy do białek i kwasów nukleinowych.
Substancje białkowe stanowią podstawę wszystkich ważnych struktur komórkowych, mają niezwykle wysoką reaktywność i są wyposażone w funkcje katalityczne.
Kwasy nukleinowe wchodzą w skład najważniejszego narządu komórkowego - jądra, a także cytoplazmy, rybosomów, mitochondriów itp. Kwasy nukleinowe odgrywają ważną, podstawową rolę w dziedziczności, zmienności organizmu i syntezie białek.

Plan synteza białko magazynowane jest w jądrze komórkowym, a bezpośrednia synteza zachodzi poza jądrem, więc jest konieczna Dostawa zakodowane plan z jądra do miejsca syntezy. Ta usługa dostarczania jest wykonywana przez cząsteczki RNA.

Proces rozpoczyna się o godz rdzeń komórki: część „drabiny” DNA rozwija się i otwiera. Z tego powodu litery RNA tworzą wiązania z otwartymi literami DNA jednej z nici DNA. Enzym przenosi litery RNA, aby połączyć je w nić. Zatem litery DNA są „przepisywane” na litery RNA. Nowo utworzony łańcuch RNA zostaje rozdzielony, a „drabina” DNA ponownie się skręca. Nazywa się proces odczytywania informacji z DNA i syntezy jego matrycy RNA transkrypcja , a zsyntetyzowany RNA nazywany jest informacyjnym lub i-RNA .

Po dalszych modyfikacjach taki zakodowany mRNA jest gotowy. i-RNA wychodzi z jądra i trafia do miejsca syntezy białek, gdzie rozszyfrowane są litery i-RNA. Każdy zestaw trzech liter i-RNA tworzy „literę”, która oznacza jeden konkretny aminokwas.

Inny rodzaj RNA szuka tego aminokwasu, wychwytuje go za pomocą enzymu i dostarcza do miejsca syntezy białka. Ten RNA nazywany jest transferowym RNA lub tRNA. W miarę odczytywania i translacji wiadomości mRNA łańcuch aminokwasów rośnie. Łańcuch ten skręca się i składa w unikalny kształt, tworząc jeden rodzaj białka. Nawet proces zwijania białek jest niezwykły: do obliczenia wszystkiego trzeba użyć komputera opcje zwinięcie średniej wielkości białka składającego się ze 100 aminokwasów zajęłoby 1027 (!) lat. A utworzenie w organizmie łańcucha 20 aminokwasów zajmuje nie więcej niż jedną sekundę, a proces ten zachodzi w sposób ciągły we wszystkich komórkach organizmu.

Geny, kod genetyczny i jego właściwości.

Na Ziemi żyje około 7 miliardów ludzi. Z wyjątkiem 25-30 milionów par identycznych bliźniąt, to genetycznie wszyscy ludzie są inni : każdy jest wyjątkowy, ma unikalne cechy dziedziczne, cechy charakteru, zdolności, temperament.

Takie różnice zostały wyjaśnione różnice w genotypach- zestawy genów organizmu; każdy jest wyjątkowy. Ucieleśnione są cechy genetyczne konkretnego organizmu w białkach - w konsekwencji struktura białka jednej osoby różni się, choć nieco, od białka innej osoby.

To nie znaczyże ludzie nie mają dokładnie tych samych białek. Białka spełniające te same funkcje mogą być takie same lub bardzo nieznacznie różnić się od siebie jednym lub dwoma aminokwasami. Ale nie istnieje na Ziemi ludzi (z wyjątkiem bliźniaków jednojajowych), w których byłyby wszystkie białka są takie same .

Informacje o strukturze pierwszorzędowej białka kodowany jako sekwencja nukleotydów w odcinku cząsteczki DNA, gen - jednostka dziedzicznej informacji organizmu. Każda cząsteczka DNA zawiera wiele genów. Całość składa się z wszystkich genów organizmu genotyp . Zatem,

Gen jest jednostką dziedzicznej informacji organizmu, która odpowiada oddzielnej części DNA

Informacje dziedziczne są kodowane za pomocą kod genetyczny , który jest uniwersalny dla wszystkich organizmów i różni się jedynie naprzemiennością nukleotydów tworzących geny i kodujących białka określonych organizmów.

Kod genetyczny składa się z tripletów (tripletów) nukleotydów DNA, które łączą się w różne sekwencje (AAT, HCA, ACH, THC itp.), z których każda koduje specyficzny aminokwas (który zostanie wbudowany w łańcuch polipeptydowy).

Faktycznie kod liczy sekwencja nukleotydów w cząsteczce i-RNA , ponieważ usuwa informację z DNA (proces transkrypcje ) i przekłada go na sekwencję aminokwasów w cząsteczkach syntetyzowanych białek (proces transmisje ).
Skład mRNA obejmuje nukleotydy A-C-G-U, których trójki nazywane są kodony : triplet DNA CHT na mRNA stanie się tripletem HCA, a triplet DNA AAG stanie się tripletem UUC. Dokładnie kodony i-RNA odzwierciedla kod genetyczny w zapisie.

Zatem, kod genetyczny - ujednolicony system zapisu informacji dziedzicznej w cząsteczkach kwasu nukleinowego w postaci sekwencji nukleotydów . Kod genetyczny opiera się na zastosowaniu alfabetu składającego się jedynie z czterech liter nukleotydów różniących się zasadami azotowymi: A, T, G, C.

Główne właściwości kodu genetycznego:

1. Kod genetyczny tryplet. Triplet (kodon) to sekwencja trzech nukleotydów kodująca jeden aminokwas. Ponieważ białka zawierają 20 aminokwasów, oczywiste jest, że każdy z nich nie może być kodowany przez jeden nukleotyd ( ponieważ w DNA są tylko cztery rodzaje nukleotydów, w tym przypadku 16 aminokwasów pozostaje niekodowanych). Dwa nukleotydy do kodowania aminokwasów również nie wystarczą, ponieważ w tym przypadku można zakodować tylko 16 aminokwasów. Oznacza to, że najmniejsza liczba nukleotydów kodujących jeden aminokwas musi wynosić co najmniej trzy. W tym przypadku liczba możliwych trójek nukleotydów wynosi 43 = 64.

2. Redundancja (degeneracja) Kod jest konsekwencją jego tripletowego charakteru i oznacza, że ​​jeden aminokwas może być kodowany przez kilka tripletów (ponieważ jest 20 aminokwasów, a są 64 triplety), z wyjątkiem metioniny i tryptofanu, które są kodowane tylko przez jeden tryplet. Ponadto niektóre trojaczki pełnią określone funkcje: w cząsteczce mRNA trójki UAA, UAG, UGA pełnią funkcję kodonów terminujących, tj. zatrzymywać się-sygnały zatrzymujące syntezę łańcucha polipeptydowego. Trójka odpowiadająca metioninie (AUG), stojąca na początku łańcucha DNA, nie koduje aminokwasu, lecz pełni funkcję inicjującą (ekscytującą) lekturę.

3. Jednoznaczność code - wraz z redundancją kod ma właściwość wyjątkowość : tylko każdy kodon pasuje jeden konkretny aminokwas.

4. Współliniowość kod, tj. sekwencja nukleotydów w genie Dokładnie odpowiada sekwencji aminokwasów w białku.

5. Kod genetyczny niezachodzące na siebie i zwarte , tj. nie zawiera „znaków interpunkcyjnych”. Oznacza to, że proces odczytu nie dopuszcza możliwości nakładania się kolumn (tripletów) i począwszy od określonego kodonu, odczyt przebiega w sposób ciągły potrójny po triplecie, aż do zatrzymywać się-sygnały ( kodony terminacyjne).

6. Kod genetyczny uniwersalny , tj. geny jądrowe wszystkich organizmów kodują informację o białkach w ten sam sposób, niezależnie od poziomu organizacji i systematycznej pozycji tych organizmów.

Istnieć tablice kodu genetycznego do odszyfrowania kodony i-RNA i budowa łańcuchów cząsteczek białek.

Reakcje syntezy macierzy.

W układach żywych zachodzą reakcje nieznane w przyrodzie nieożywionej - reakcje syntezy matrycy.

Termin „matryca” w technologii oznaczają formę stosowaną do odlewania monet, medali, typograficzną: hartowany metal dokładnie odwzorowuje wszystkie szczegóły formy użytej do odlewu. Synteza macierzy przypomina odlewanie na matrycy: nowe cząsteczki syntetyzowane są ściśle według planu zapisanego w strukturze już istniejących cząsteczek.

Zasada matrycy kłamie u źródła najważniejsze reakcje syntetyczne komórki, takie jak synteza kwasów nukleinowych i białek. W reakcjach tych dostarczana jest dokładna, ściśle specyficzna sekwencja jednostek monomerycznych w syntetyzowanych polimerach.

To jest miejsce kierunkowe ciągnięcie monomerów w określone miejsce komórki - na cząsteczki, które służą jako matryca, w której zachodzi reakcja. Gdyby takie reakcje zachodziły w wyniku przypadkowego zderzenia cząsteczek, przebiegałyby nieskończenie wolno. Synteza złożonych cząsteczek w oparciu o zasadę matrix odbywa się szybko i dokładnie. Rola matrycy makrocząsteczki kwasów nukleinowych biorą udział w reakcjach matrixu DNA lub RNA .

cząsteczki monomeryczne, z których syntetyzowany jest polimer – nukleotydy lub aminokwasy – zgodnie z zasadą komplementarności, układają się i utrwalają na matrycy w ściśle określonej, z góry ustalonej kolejności.

Potem przychodzi „sieciowanie” jednostek monomeru w łańcuch polimeru i gotowy polimer zostaje usunięty z matrycy.

Po tym matryca gotowa do złożenia nowej cząsteczki polimeru. Jasne jest, że tak jak na daną formę można odlać tylko jedną monetę, jedną literę, tak też na danej cząsteczce matrixa można „złożyć” tylko jeden polimer.

Reakcje typu macierzowego- specyficzna cecha chemii układów żywych. Stanowią podstawę podstawowej właściwości wszystkich żywych istot - ich zdolności do reprodukcji własnego rodzaju.

Reakcje syntezy macierzy

1. replikacja DNA - replikacja (od łac. replikacja - odnowienie) - proces syntezy cząsteczki potomnej kwasu dezoksyrybonukleinowego na matrixie macierzystej cząsteczki DNA. Podczas kolejnego podziału komórki macierzystej każda komórka potomna otrzymuje jedną kopię cząsteczki DNA, która jest identyczna z DNA pierwotnej komórki macierzystej. Proces ten zapewnia dokładne przekazywanie informacji genetycznej z pokolenia na pokolenie. Replikacja DNA odbywa się za pomocą złożonego kompleksu enzymatycznego, składającego się z 15-20 różnych białek, tzw miły . Materiałem do syntezy są wolne nukleotydy obecne w cytoplazmie komórek. Biologiczne znaczenie replikacji polega na dokładnym przekazaniu informacji dziedzicznej z cząsteczki macierzystej na cząsteczkę potomną, co zwykle następuje podczas podziału komórek somatycznych.

Cząsteczka DNA składa się z dwóch komplementarnych nici. Łańcuchy te są utrzymywane razem przez słabe wiązania wodorowe, które mogą zostać rozerwane przez enzymy. Cząsteczka DNA jest zdolna do samopodwajania się (replikacji), a na każdej starej połowie cząsteczki syntetyzowana jest nowa jej połowa.
Ponadto cząsteczkę mRNA można zsyntetyzować na cząsteczce DNA, która następnie przekazuje informację otrzymaną z DNA do miejsca syntezy białka.

Przekazywanie informacji i synteza białek przebiegają na zasadzie matrycy, porównywalnej do pracy prasy drukarskiej w drukarni. Informacje z DNA są kopiowane w kółko. Jeśli podczas kopiowania wystąpią błędy, będą one powtarzane we wszystkich kolejnych kopiach.

To prawda, że ​​​​niektóre błędy w kopiowaniu informacji przez cząsteczkę DNA można skorygować - nazywa się to procesem eliminowania błędów remont. Pierwszą z reakcji w procesie przekazywania informacji jest replikacja cząsteczki DNA i synteza nowych nici DNA.

2. Transkrypcja (z łac. transkrypcja – przepisywanie) – proces syntezy RNA z wykorzystaniem DNA jako matrycy, zachodzący we wszystkich żywych komórkach. Inaczej mówiąc, jest to transfer informacji genetycznej z DNA na RNA.

Transkrypcja jest katalizowana przez enzym polimerazę RNA zależną od DNA. Polimeraza RNA porusza się wzdłuż cząsteczki DNA w kierunku 3 „ → 5”. Transkrypcja składa się z etapów inicjacja, elongacja i terminacja . Jednostką transkrypcji jest operon, fragment cząsteczki DNA składający się z promotor, transkrybowane ugrupowanie i terminator . i-RNA składa się z jednej nici i jest syntetyzowany na DNA zgodnie z zasadą komplementarności przy udziale enzymu, który aktywuje początek i koniec syntezy cząsteczki i-RNA.

Gotowa cząsteczka mRNA wchodzi do cytoplazmy na rybosomach, gdzie zachodzi synteza łańcuchów polipeptydowych.

3. Audycja (z łac. tłumaczenie- transfer, ruch) - proces syntezy białek z aminokwasów na matrycy informacyjnej (macierzy) RNA (mRNA, mRNA) prowadzony przez rybosom. Innymi słowy, jest to proces tłumaczenia informacji zawartej w sekwencji nukleotydowej i-RNA na sekwencję aminokwasów w polipeptydzie.

4. transkrypcja odwrotna to proces tworzenia dwuniciowego DNA na podstawie informacji z jednoniciowego RNA. Proces ten nazywa się odwrotną transkrypcją, ponieważ transfer informacji genetycznej zachodzi w kierunku „odwrotnym” w stosunku do transkrypcji. Idea odwrotnej transkrypcji była początkowo bardzo niepopularna, gdyż była sprzeczna z centralnym dogmatem biologii molekularnej, który zakładał, że DNA ulega transkrypcji na RNA, a następnie ulega translacji na białka.

Jednakże w 1970 roku Temin i Baltimore niezależnie odkryli enzym zwany odwrotna transkryptaza (rewertaza) i ostatecznie potwierdzono możliwość odwrotnej transkrypcji. W 1975 Temin i Baltimore otrzymali Nagrodę Nobla w dziedzinie fizjologii lub medycyny. Niektóre wirusy (takie jak ludzki wirus niedoboru odporności wywołujący zakażenie wirusem HIV) mają zdolność transkrypcji RNA na DNA. HIV ma genom RNA, który integruje się z DNA. W rezultacie DNA wirusa można połączyć z genomem komórki gospodarza. Główny enzym odpowiedzialny za syntezę DNA z RNA nazywa się rewertaza. Jedną z funkcji Reversase jest tworzenie komplementarnego DNA (cDNA) z genomu wirusa. Powiązany enzym rybonukleaza rozszczepia RNA, a odwrotnataza syntetyzuje cDNA z podwójnej helisy DNA. cDNA jest integrowany z genomem komórki gospodarza przez integrazę. Wynik to synteza białek wirusowych przez komórkę gospodarza które tworzą nowe wirusy. W przypadku wirusa HIV programowana jest także apoptoza (śmierć komórek) limfocytów T. W innych przypadkach komórka może pozostać dystrybutorem wirusów.

Sekwencję reakcji matrycowych w biosyntezie białek można przedstawić w formie diagramu.

Zatem, biosynteza białek- jest to jeden z rodzajów wymiany plastycznej, podczas którego dziedziczna informacja zakodowana w genach DNA realizowana jest w określonej sekwencji aminokwasów w cząsteczkach białka.

Zasadniczo są to cząsteczki białka łańcuchy polipeptydowe zbudowane z pojedynczych aminokwasów. Ale aminokwasy nie są wystarczająco aktywne, aby same się ze sobą łączyć. Dlatego zanim połączą się ze sobą i utworzą cząsteczkę białka, muszą to być aminokwasy Aktywuj . Aktywacja ta następuje pod wpływem specjalnych enzymów.

W wyniku aktywacji aminokwas staje się bardziej labilny i pod działaniem tego samego enzymu wiąże się z t- RNA. Każdy aminokwas odpowiada ściśle określonemu t- RNA, który znajduje „swój” aminokwas i wytrzymuje go do rybosomu.

Dlatego rybosom otrzymuje różne aktywowane aminokwasy połączone z ich T- RNA. Rybosom jest podobny przenośnik do złożenia łańcucha białkowego z różnych wchodzących do niego aminokwasów.

Równolegle z t-RNA, na którym „siedzi” swój własny aminokwas, „ sygnał» z DNA zawartego w jądrze. Zgodnie z tym sygnałem w rybosomie syntetyzowane jest jedno lub drugie białko.

Kierujący wpływ DNA na syntezę białek nie odbywa się bezpośrednio, ale za pomocą specjalnego pośrednika - matryca Lub informacyjny RNA (mRNA Lub i-RNA), Który syntetyzowany w jądrze DNA nie ma na niego wpływu, więc jego skład odzwierciedla skład DNA. Cząsteczka RNA jest jakby odlewem z formy DNA. Zsyntetyzowany mRNA wchodzi do rybosomu i niejako przenosi go do tej struktury plan- w jakiej kolejności należy łączyć ze sobą aktywowane aminokwasy wchodzące do rybosomu, aby zsyntetyzować określone białko. W przeciwnym razie, informacja genetyczna zakodowana w DNA jest przenoszona na mRNA, a następnie na białko.

Cząsteczka mRNA wchodzi do rybosomu i miga jej. Określa się ten jego segment, który aktualnie znajduje się w rybosomie kodon (triplet), oddziałuje w zupełnie specyficzny sposób z odpowiednią dla niego strukturą triplet (antykodon) w transferowym RNA, który wprowadził aminokwas do rybosomu.

Transferowy RNA wraz ze swoim aminokwasem zbliża się do pewnego kodonu mRNA i łączy z nim; do następnego, sąsiedniego miejsca i-RNA łączy inny tRNA z innym aminokwasem i tak dalej, aż zostanie odczytany cały łańcuch i-RNA, aż wszystkie aminokwasy zostaną ułożone w odpowiedniej kolejności, tworząc cząsteczkę białka. Oraz t-RNA, które dostarczyło aminokwas do określonego miejsca łańcucha polipeptydowego, uwolniony od swojego aminokwasu i opuszcza rybosom.

Następnie ponownie w cytoplazmie pożądany aminokwas może się do niego przyłączyć i ponownie przeniesie go do rybosomu. W procesie syntezy białek bierze udział nie jeden, ale kilka rybosomów, polirybosomów.

Główne etapy przekazywania informacji genetycznej:

1. Synteza na DNA jak na matrycy mRNA (transkrypcja)
2. Synteza łańcucha polipeptydowego w rybosomach według programu zawartego w i-RNA (translacja) .

Etapy są uniwersalne dla wszystkich żywych istot, ale czasowe i przestrzenne relacje tych procesów różnią się u pro- i eukariontów.

Na prokarioty transkrypcja i translacja mogą zachodzić jednocześnie, ponieważ DNA znajduje się w cytoplazmie. Na eukariont transkrypcja i translacja są ściśle oddzielone w przestrzeni i czasie: w jądrze zachodzi synteza różnych RNA, po czym cząsteczki RNA muszą opuścić jądro, przechodząc przez błonę jądrową. Następnie RNA jest transportowany w cytoplazmie do miejsca syntezy białka.

Wykład 5 Kod genetyczny

Definicja pojęcia

Kod genetyczny to system zapisu informacji o sekwencji aminokwasów w białkach na podstawie sekwencji nukleotydów w DNA.

Ponieważ DNA nie bierze bezpośredniego udziału w syntezie białek, kod jest napisany w języku RNA. RNA zawiera uracyl zamiast tyminy.

Właściwości kodu genetycznego

1. Trójca

Każdy aminokwas jest kodowany przez sekwencję 3 nukleotydów.

Definicja: Triplet lub kodon to sekwencja trzech nukleotydów kodująca jeden aminokwas.

Kod nie może być monopletowy, ponieważ 4 (liczba różnych nukleotydów w DNA) jest mniejsza niż 20. Kodu nie można dublować, ponieważ 16 (liczba kombinacji i permutacji 4 nukleotydów przez 2) jest mniejsza niż 20. Kod może być trójkowy, ponieważ 64 (liczba kombinacji i permutacji od 4 do 3) jest większa niż 20.

2. Degeneracja.

Wszystkie aminokwasy, z wyjątkiem metioniny i tryptofanu, są kodowane przez więcej niż jedną trójkę:

2 AK za 1 trójkę = 2.

9 AK x 2 trójki = 18.

1 AK 3 trójki = 3.

5 AK x 4 trójki = 20.

3 AK x 6 trójek = 18.

W sumie 61 kodów tripletowych dla 20 aminokwasów.

3. Obecność międzygenowych znaków interpunkcyjnych.

Definicja:

Gen to odcinek DNA kodujący jeden łańcuch polipeptydowy lub jedną cząsteczkę tPHK, RRNA lubsPHK.

GenytPHK, rPHK, sPHKbiałka nie kodują.

Na końcu każdego genu kodującego polipeptyd znajduje się co najmniej jedna z 3 trójek kodujących kodony stop RNA, czyli sygnały stop. W mRNA wyglądają one tak: UAA, UAG, UGA . Kończą (kończą) transmisję.

Konwencjonalnie kodon dotyczy również znaków interpunkcyjnych SIERPIEŃ - pierwszy po sekwencji lidera. (Patrz wykład 8) Pełni funkcję dużej litery. W tej pozycji koduje formylometioninę (u prokariotów).

4. Wyjątkowość.

Każdy triplet koduje tylko jeden aminokwas lub jest terminatorem translacji.

Wyjątkiem jest kodon SIERPIEŃ . U prokariotów na pierwszej pozycji (duża litera) koduje formylometioninę, a na każdej innej pozycji koduje metioninę.

5. Zwartość, czyli brak wewnątrzgenowych znaków interpunkcyjnych.
W genie każdy nukleotyd jest częścią znaczącego kodonu.

W 1961 roku Seymour Benzer i Francis Crick eksperymentalnie udowodnili, że kod jest trójkowy i zwarty.

Istota doświadczenia: Mutacja „+” – insercja jednego nukleotydu. Mutacja „-” – utrata jednego nukleotydu. Pojedyncza mutacja „+” lub „-” na początku genu powoduje uszkodzenie całego genu. Podwójna mutacja „+” lub „-” również psuje cały gen.

Potrójna mutacja „+” lub „-” na początku genu psuje tylko jego część. Poczwórna mutacja „+” lub „-” ponownie psuje cały gen.

Eksperyment to potwierdza kod jest trójkowy i wewnątrz genu nie ma znaków interpunkcyjnych. Doświadczenie przeprowadzono na dwóch sąsiednich genach fagów i dodatkowo wykazano, że obecność znaków interpunkcyjnych między genami.

6. Wszechstronność.

Kod genetyczny jest taki sam dla wszystkich stworzeń żyjących na Ziemi.

W 1979 roku otwarto Burrell ideał ludzki kod mitochondrialny.

Definicja:

„Idealny” to kod genetyczny, w którym spełniona jest zasada degeneracji kodu quasi-dubletu: jeśli pierwsze dwa nukleotydy w dwóch tripletach pokrywają się, a trzeci nukleotyd należy do tej samej klasy (oba są purynami lub oba są pirymidynami) , wówczas te trojaczki kodują ten sam aminokwas .

Istnieją dwa wyjątki od tej reguły w kodzie ogólnym. Obydwa odchylenia od idealnego kodu w uniwersalnym odnoszą się do zasadniczych punktów: początku i końca syntezy białek:

kodon

uniwersalny

kod

Kody mitochondrialne

Kręgowce

Bezkręgowce

Drożdże

Rośliny

ZATRZYMYWAĆ SIĘ

ZATRZYMYWAĆ SIĘ

Z UA

AGA

ZATRZYMYWAĆ SIĘ

ZATRZYMYWAĆ SIĘ

230 podstawień nie zmienia klasy kodowanego aminokwasu. na rozrywalność.

W 1956 roku Georgy Gamov zaproponował wariant nakładającego się kodu. Zgodnie z kodem Gamowa każdy nukleotyd, począwszy od trzeciego w genie, jest częścią 3 kodonów. Po rozszyfrowaniu kodu genetycznego okazało się, że nie nakłada się on na siebie, tj. każdy nukleotyd jest częścią tylko jednego kodonu.

Zalety nakładającego się kodu genetycznego: zwartość, mniejsza zależność struktury białka od insercji lub delecji nukleotydu.

Wada: duża zależność struktury białka od podstawienia nukleotydów i ograniczenia do sąsiadów.

W 1976 roku zsekwencjonowano DNA faga φX174. Ma jednoniciowy kolisty DNA składający się z 5375 nukleotydów. Wiadomo było, że fag koduje 9 białek. W przypadku 6 z nich zidentyfikowano geny zlokalizowane jeden po drugim.

Okazało się, że zachodzi nakładanie się. Gen E znajduje się całkowicie w obrębie genu D . Jego kodon inicjacyjny pojawia się w wyniku przesunięcia o jeden nukleotyd w odczycie. Gen J zaczyna się tam, gdzie kończy się gen D . Kodon inicjacji genu J pokrywa się z kodonem terminacyjnym genu D wskutek przesunięcia dwóch nukleotydów. Projekt nazywa się „przesunięciem ramki odczytu” ze względu na liczbę nukleotydów, która nie jest wielokrotnością trzech. Do tej pory nakładanie się pokazano tylko w przypadku kilku fagów.

Pojemność informacyjna DNA

Na Ziemi żyje 6 miliardów ludzi. Informacje dziedziczne na ich temat
zamknięty w 6x10 9 plemnikach. Według różnych szacunków człowiek ma od 30 do 50 lat
tysiąc genów. Wszyscy ludzie mają ~30x10 13 genów lub 30x10 16 par zasad, które tworzą 10 17 kodonów. Przeciętna strona książki zawiera 25x10 2 znaków. DNA plemników 6x10 9 zawiera informację o objętości równej w przybliżeniu

4x10 13 stron książki. Strony te zajmowałyby objętość 6 budynków NSU. Plemniki 6x10 9 zajmują połowę naparstka. Ich DNA zajmuje mniej niż jedną czwartą naparstka.

KOD GENETYCZNY(greckie, genetikos odnoszące się do pochodzenia; syn.: kod, kod biologiczny, kod aminokwasowy, kod białkowy, kod kwasu nukleinowego) - system zapisywania informacji dziedzicznej w cząsteczkach kwasów nukleinowych zwierząt, roślin, bakterii i wirusów poprzez naprzemienną sekwencję nukleotydów.

Informacja genetyczna (ryc.) z komórki do komórki, z pokolenia na pokolenie, z wyjątkiem wirusów zawierających RNA, jest przekazywana poprzez reduplikację cząsteczek DNA (patrz Replikacja). Wdrożenie dziedzicznej informacji DNA w trakcie życia komórki odbywa się poprzez 3 rodzaje RNA: informacyjny (mRNA lub mRNA), rybosomalny (rRNA) i transportowy (tRNA), które są syntetyzowane na DNA jak na matrycy za pomocą enzymu polimerazy RNA. Jednocześnie sekwencja nukleotydów w cząsteczce DNA jednoznacznie określa sekwencję nukleotydów we wszystkich trzech typach RNA (patrz Transkrypcja). Informacja o genie (patrz) kodującym cząsteczkę białkową jest przenoszona wyłącznie przez mRNA. Końcowym produktem wdrożenia informacji dziedzicznej jest synteza cząsteczek białek, których specyficzność zależy od sekwencji ich aminokwasów (patrz Tłumaczenie).

Ponieważ w DNA lub RNA obecne są tylko 4 różne zasady azotowe [w DNA - adenina (A), tymina (T), guanina (G), cytozyna (C); w RNA – adenina (A), uracyl (U), cytozyna (C), guanina (G)], którego sekwencja warunkuje kolejność 20 aminokwasów w białku, problem G. do., tj. problem przełożenia 4-literowego alfabetu kwasów nukleinowych na 20-literowy alfabet polipeptydów.

Po raz pierwszy pomysł syntezy matrycy cząsteczek białka z prawidłowym przewidywaniem właściwości hipotetycznej matrycy sformułował N. K. Koltsov w 1928 r. W 1944 r. Avery (O. Avery) i in. odkryli, że DNA cząsteczki są odpowiedzialne za przenoszenie cech dziedzicznych podczas transformacji u pneumokoków. W 1948 r. E. Chargaff wykazał, że we wszystkich cząsteczkach DNA istnieje ilościowa równość odpowiednich nukleotydów (A-T, G-C). W 1953 r. F. Crick, J. Watson i Wilkins (M. H. F. Wilkins), w oparciu o tę zasadę i dane z analizy dyfrakcji promieni rentgenowskich (patrz), doszli do wniosku, że cząsteczka DNA jest podwójną helisą, składającą się z dwóch polinukleotydów nici połączone ze sobą wiązaniami wodorowymi. Co więcej, tylko T może znajdować się naprzeciw A jednego łańcucha w drugim, a tylko C naprzeciw G. Ta komplementarność prowadzi do tego, że sekwencja nukleotydów jednego łańcucha jednoznacznie determinuje sekwencję drugiego. Drugim istotnym wnioskiem wynikającym z tego modelu jest to, że cząsteczka DNA jest zdolna do samoreprodukcji.

W 1954 roku G. Gamow sformułował problem G. w jego nowoczesnej formie. W 1957 roku F. Crick sformułował Hipotezę Adaptera, zakładając, że aminokwasy oddziałują z kwasem nukleinowym nie bezpośrednio, ale poprzez pośredników (obecnie znanych jako tRNA). W następnych latach wszystkie główne ogniwa ogólnego schematu przekazywania informacji genetycznej, początkowo hipotetycznej, zostały potwierdzone eksperymentalnie. W 1957 roku odkryto mRNA [A. S. Spirin, A. N. Belozersky i in.; Folkin i Astrakhan (E. Volkin, L. Astrachan)] i tRNA [Hoagland (M. V. Hoagland)]; w 1960 roku przeprowadzono syntezę DNA poza komórką, wykorzystując jako matrycę istniejące makrocząsteczki DNA (A. Kornberg) i odkryto zależną od DNA syntezę RNA [Weiss (S. V. Weiss) i in.]. W 1961 roku stworzono system bezkomórkowy, w którym w obecności naturalnego RNA lub syntetycznych polirybonukleotydów syntetyzowano substancje białkowe [M. Nirenberg i Matthaei (J. H. Matthaei)]. Zagadnienie poznania G. to. polegało na zbadaniu ogólnych właściwości kodu i faktycznym jego rozszyfrowaniu, czyli ustaleniu, jakie kombinacje nukleotydów (kodonów) kodują określone aminokwasy.

Ogólne właściwości kodu wyjaśniono niezależnie od jego dekodowania, a głównie przed nim, analizując molekularne wzorce powstawania mutacji (F. Crick i in., 1961; N. V. Luchnik, 1963). Sprowadzają się do tego:

1. Kod jest uniwersalny, tj. identyczny, przynajmniej w większości, dla wszystkich istot żywych.

2. Kod jest tripletowy, to znaczy każdy aminokwas jest kodowany przez potrójną nukleotydów.

3. Kod nie nakłada się, tzn. dany nukleotyd nie może należeć do więcej niż jednego kodonu.

4. Kod jest zdegenerowany, to znaczy, że jeden aminokwas może być kodowany przez kilka trójek.

5. Informacje o pierwszorzędowej strukturze białka odczytywane są z mRNA sekwencyjnie, zaczynając od ustalonego punktu.

6. Większość możliwych trójek ma „znaczenie”, tj. koduje aminokwasy.

7. Z trzech „liter” kodonu tylko dwie (obowiązkowe) mają pierwszorzędne znaczenie, natomiast trzecia (opcjonalna) niesie znacznie mniej informacji.

Bezpośrednie rozszyfrowanie kodu polegałoby na porównaniu sekwencji nukleotydowej w genie strukturalnym (lub syntetyzowanym na nim mRNA) z sekwencją aminokwasową w odpowiednim białku. Jednak taki sposób jest nadal technicznie niemożliwy. Zastosowano dwa inne sposoby: syntezę białek w układzie bezkomórkowym przy użyciu sztucznych polirybonukleotydów o znanym składzie jako matrycy oraz analizę molekularnych wzorców powstawania mutacji (patrz). Pierwsza przyniosła pozytywne rezultaty wcześniej i historycznie odegrała dużą rolę w rozszyfrowaniu G. do.

W 1961 r. M. Nirenberg i Mattei zastosowali jako matrycę homopolimer - syntetyczny kwas poliurydylowy (tj. sztuczny RNA o składzie UUUU…) i otrzymali polifenyloalaninę. Z tego wynika, że ​​kodon fenyloalaniny składa się z kilku U, czyli w przypadku kodu tripletowego oznacza UUU. Później, wraz z homopolimerami, zaczęto stosować polirybonukleotydy składające się z różnych nukleotydów. W tym przypadku znany był jedynie skład polimerów, natomiast rozmieszczenie w nich nukleotydów miało charakter statystyczny, dlatego analiza wyników miała charakter statystyczny i dawała wnioski pośrednie. Dość szybko udało nam się znaleźć przynajmniej jedną trójkę dla wszystkich 20 aminokwasów. Okazało się, że obecność rozpuszczalników organicznych, zmiany pH czy temperatury, niektórych kationów, a zwłaszcza antybiotyków powodują, że kod jest niejednoznaczny: te same kodony zaczynają stymulować włączenie innych aminokwasów, w niektórych przypadkach jeden kodon zaczyna kodować aż cztery różne aminokwasy. Streptomycyna wpływała na odczyt informacji zarówno w układach bezkomórkowych, jak i in vivo i była skuteczna tylko w przypadku szczepów bakterii wrażliwych na streptomycynę. W przypadku szczepów zależnych od streptomycyny „poprawił” odczyt kodonów, które uległy zmianie w wyniku mutacji. Podobne wyniki dały podstawy do wątpliwości co do poprawności dekodowania G. za pomocą systemu bezkomórkowego; wymagane było potwierdzenie, przede wszystkim danymi in vivo.

Główne dane na temat G. do. in vivo uzyskano analizując skład aminokwasowy białek w organizmach traktowanych mutagenami (patrz) o znanym mechanizmie działania, na przykład azotowym do jednego, co powoduje zastąpienie C przez U i A przez D. Przydatnych informacji dostarcza także analiza mutacji wywołanych przez niespecyficzne mutageny, porównanie różnic w strukturze pierwszorzędowej spokrewnionych białek u różnych gatunków, korelacja pomiędzy składem DNA i białek itp.

Dekodowanie G. na podstawie danych in vivo i in vitro dało zbieżne wyniki. Później opracowano trzy inne metody rozszyfrowania kodu w układach bezkomórkowych: wiązanie aminoacylo-tRNA (tRNA z przyłączonym aktywowanym aminokwasem) z trójnukleotydami o znanym składzie (M. Nirenberg i in., 1965), wiązanie aminoacylo-tRNA z polinukleotydami zaczynającymi się od określonej trójki (Mattei i in., 1966) oraz zastosowanie polimerów jako mRNA, w którym znany jest nie tylko skład, ale i kolejność nukleotydów (X. Korana i in., ., 1965). Wszystkie trzy metody uzupełniają się, a wyniki są zgodne z danymi uzyskanymi w doświadczeniach in vivo.

W latach 70. XX wiek istniały metody szczególnie wiarygodnej weryfikacji wyników dekodowania G. Wiadomo, że mutacje zachodzące pod wpływem proflawiny polegają na utracie lub insercji poszczególnych nukleotydów, co prowadzi do przesunięcia ramki odczytu. U faga T4 proflawina wywołała szereg mutacji, w wyniku których zmienił się skład lizozymu. Skład ten analizowano i porównywano z kodonami, które należało uzyskać poprzez przesunięcie ramki odczytu. Doszło do pełnego meczu. Dodatkowo metoda ta umożliwiła ustalenie, które triplety zdegenerowanego kodu kodują każdy z aminokwasów. W 1970 roku Adamsowi (J. M. Adamsowi) i jego współpracownikom udało się częściowo rozszyfrować G. to. metodą bezpośrednią: w fagu R17 określono sekwencję zasad we fragmencie o długości 57 nukleotydów i porównano z sekwencją aminokwasów faga R17. jego białko otoczki. Wyniki były całkowicie zgodne z wynikami uzyskanymi metodami mniej bezpośrednimi. W ten sposób kod zostaje odszyfrowany całkowicie i poprawnie.

Wyniki dekodowania podsumowano w tabeli. Wymienia skład kodonów i RNA. Skład antykodonów tRNA jest komplementarny do kodonów mRNA, tj. zamiast U zawierają A, zamiast A - U, zamiast C - G i zamiast G - C i odpowiadają kodonom genu strukturalnego (tej nici DNA, za pomocą którego odczytywane są informacje) z tą tylko różnicą, że uracyl zastępuje tyminę. Z 64 trójek, które można utworzyć przez kombinację 4 nukleotydów, 61 ma „sens”, tj. koduje aminokwasy, a 3 to „nonsens” (pozbawione znaczenia). Istnieje dość wyraźny związek między składem trójek a ich znaczeniem, co odkryto nawet analizując ogólne właściwości kodu. W niektórych przypadkach triplety kodujące konkretny aminokwas (np. prolinę, alaninę) charakteryzują się tym, że pierwsze dwa nukleotydy (obowiązkowe) są takie same, a trzeci (opcjonalnie) może być dowolny. W innych przypadkach (przy kodowaniu np. asparaginy, glutaminy) dwie podobne trójki mają to samo znaczenie, w którym pierwsze dwa nukleotydy pokrywają się, a dowolna puryna lub dowolna pirymidyna zajmuje miejsce trzeciego.

Kodony nonsensowne, z czego 2 mają specjalne nazwy odpowiadające oznaczeniu mutantów fagowych (UAA-ochra, UAG-bursztyn, UGA-opal), choć nie kodują żadnych aminokwasów, mają ogromne znaczenie przy odczytywaniu informacji, kodowaniu koniec łańcucha polipeptydowego.

Informacje odczytywane są w kierunku od 5 1 -> 3 1 - do końca łańcucha nukleotydowego (patrz Kwasy dezoksyrybonukleinowe). W tym przypadku synteza białka przebiega od aminokwasu z wolną grupą aminową do aminokwasu z wolną grupą karboksylową. Początek syntezy jest kodowany przez triplety AUG i GUG, które w tym przypadku obejmują specyficzny wyjściowy aminoacylo-tRNA, mianowicie N-formylometionylo-tRNA. Te same trojaczki, zlokalizowane w łańcuchu, kodują odpowiednio metioninę i walinę. Dwuznaczność usuwa fakt, że początek lektury poprzedzają bzdury. Istnieją dowody na to, że granica pomiędzy regionami mRNA kodującymi różne białka składa się z więcej niż dwóch trójek i że w tych miejscach zmienia się struktura drugorzędowa RNA; kwestia ta jest badana. Jeśli w genie strukturalnym występuje kodon nonsensowny, wówczas odpowiednie białko jest budowane tylko do miejsca, w którym znajduje się ten kodon.

Odkrycie i rozszyfrowanie kodu genetycznego - wybitne osiągnięcie biologii molekularnej - wywarło wpływ na wszystkie nauki biologiczne, w niektórych przypadkach kładąc podwaliny pod rozwój specjalnych dużych sekcji (patrz Genetyka molekularna). Efekt otwarcia G. i związane z nim badania można porównać z efektem, jaki teoria Darwina wywarła na nauki biologiczne.

Uniwersalność G. to. jest bezpośrednim dowodem uniwersalności podstawowych molekularnych mechanizmów życia u wszystkich przedstawicieli świata organicznego. Tymczasem duże różnice w funkcjach aparatu genetycznego i jego strukturze podczas przejścia od prokariotów do eukariotów i od jednokomórkowych do wielokomórkowych wiążą się prawdopodobnie z różnicami molekularnymi, których badanie jest jednym z zadań przyszłości. Ponieważ badania G. to dopiero kwestia ostatnich lat, znaczenie uzyskanych wyników dla medycyny praktycznej ma jedynie charakter pośredni, pozwalający na razie zrozumieć naturę chorób, mechanizm działania patogenów i substancje lecznicze. Jednak odkrycie takich zjawisk, jak transformacja (patrz), transdukcja (patrz), tłumienie (patrz), wskazuje na zasadniczą możliwość korygowania patologicznie zmienionej informacji dziedzicznej lub jej korekty - tzw. inżynieria genetyczna (patrz).

Tabela. KOD GENETYCZNY

Pierwszy nukleotyd kodonu

Drugi nukleotyd kodonu

Po trzecie, nukleotyd kodonu

Fenyloalanina

J. Nonsens

tryptofan

Histydyna

Kwas glutaminowy

Izoleucyna

Asparaginowy

Metionina

Asparagina

Glutamina

* Koduje koniec łańcucha.

** Koduje również początek łańcucha.

Bibliografia: Ichas M. Kod biologiczny, przeł. z języka angielskiego, M., 1971; Łucznik N.B. Biofizyka porażek cytogenetycznych i kod genetyczny, L., 1968; Genetyka molekularna, przeł. z języka angielskiego, wyd. A. N. Belozersky, część 1, M., 1964; Kwasy nukleinowe, trans. z języka angielskiego, wyd. A. N. Biełozerski, Moskwa 1965. Watson JD Biologia molekularna genu, przeł. z języka angielskiego, M., 1967; Genetyka fizjologiczna, wyd. M. E. Lobasheva S. G., Inge-Vechtoma-va, L., 1976, bibliogr.; Desoksyrybonukleiny i mocz, Schlttssel des Lebens, hrsg. v „E. Geissler, B., 1972; Kod genetyczny, Gold Spr. Harb. Symp. ilość. Biol., w. 31, 1966; Wo e s e C. R. Kod genetyczny, N. Y. a. o., 1967.

Kod genetyczny to system zapisu informacji dziedzicznej w cząsteczkach kwasu nukleinowego, oparty na pewnej przemianie sekwencji nukleotydów w DNA lub RNA, które tworzą kodony odpowiadające aminokwasom w białku.

Właściwości kodu genetycznego.

Kod genetyczny ma kilka właściwości.

    Potrójność.

    Degeneracja lub redundancja.

    Jednoznaczność.

    Biegunowość.

    Nie nakładające się.

    Ścisłość.

    Wszechstronność.

Należy zaznaczyć, że niektórzy autorzy podają także inne właściwości kodu związane z właściwościami chemicznymi nukleotydów zawartych w kodzie czy z częstotliwością występowania poszczególnych aminokwasów w białkach organizmu itp. Jednak te właściwości wynikają z powyższego, więc rozważymy je tam.

A. Potrójność. Kod genetyczny, podobnie jak wiele skomplikowanych systemów, ma najmniejszą jednostkę strukturalną i najmniejszą funkcjonalną. Trójka jest najmniejszą jednostką strukturalną kodu genetycznego. Składa się z trzech nukleotydów. Kodon jest najmniejszą jednostką funkcjonalną kodu genetycznego. Z reguły tryplety mRNA nazywane są kodonami. W kodzie genetycznym kodon pełni kilka funkcji. Po pierwsze, jego główną funkcją jest kodowanie jednego aminokwasu. Po drugie, kodon może nie kodować aminokwasu, ale w tym przypadku pełni inną funkcję (patrz poniżej). Jak widać z definicji, trójka jest pojęciem charakteryzującym podstawowy jednostka strukturalna kod genetyczny (trzy nukleotydy). kodon charakteryzuje elementarna jednostka semantyczna genom - trzy nukleotydy decydują o przyłączeniu do łańcucha polipeptydowego jednego aminokwasu.

Elementarną jednostkę strukturalną najpierw rozszyfrowano teoretycznie, a następnie jej istnienie potwierdzono doświadczalnie. Rzeczywiście, 20 aminokwasów nie może być kodowanych przez jeden lub dwa nukleotydy. tych ostatnich jest tylko 4. Trzy z czterech nukleotydów dają 4 3 = 64 warianty, co więcej niż pokrywa liczbę aminokwasów występujących w organizmach żywych (patrz tabela 1).

Kombinacje nukleotydów przedstawione w Tabeli 64 mają dwie cechy. Po pierwsze, z 64 wariantów tripletów tylko 61 to kodony i kodują dowolny aminokwas. Nazywa się je kodony zmysłowe. Trzy trójki nie kodują

aminokwasy a są sygnałami stop oznaczającymi koniec translacji. Są trzy takie trojaczki UAA, UAG, UGA, są one również nazywane „bezsensownymi” (kodony nonsensowne). W wyniku mutacji, która jest związana z zastąpieniem jednego nukleotydu w triplecie innym, z kodonu sensownego może powstać pozbawiony znaczenia kodon. Ten typ mutacji nazywa się bezsensowna mutacja. Jeżeli wewnątrz genu (w jego części informacyjnej) powstanie taki sygnał stopu, to podczas syntezy białka w tym miejscu proces będzie stale przerywany – syntetyzowana będzie jedynie pierwsza (przed sygnałem stop) część białka. Osoba z taką patologią odczuje brak białka i odczuje objawy związane z tym niedoborem. Na przykład tego rodzaju mutację wykryto w genie kodującym łańcuch beta hemoglobiny. Syntetyzowany jest skrócony, nieaktywny łańcuch hemoglobiny, który ulega szybkiemu zniszczeniu. W rezultacie powstaje cząsteczka hemoglobiny pozbawiona łańcucha beta. Oczywiste jest, że jest mało prawdopodobne, aby taka cząsteczka w pełni spełniła swoje obowiązki. Istnieje poważna choroba, która rozwija się w zależności od rodzaju niedokrwistości hemolitycznej (talasemia beta-zero, od greckiego słowa „Talas” - Morze Śródziemne, gdzie po raz pierwszy odkryto tę chorobę).

Mechanizm działania kodonów stop różni się od mechanizmu działania kodonów sensownych. Wynika to z faktu, że dla wszystkich kodonów kodujących aminokwasy znaleziono odpowiadające im tRNA. Nie znaleziono tRNA dla kodonów nonsensownych. Dlatego tRNA nie bierze udziału w procesie zatrzymywania syntezy białek.

kodonSIERPIEŃ (czasami GUG u bakterii) nie tylko koduje aminokwasy metioninę i walinę, ale jest takżeinicjator transmisji .

B. Degeneracja lub redundancja.

61 z 64 trójek koduje 20 aminokwasów. Taka trzykrotna przewaga liczby tripletów nad liczbą aminokwasów sugeruje, że w przekazywaniu informacji można zastosować dwie możliwości kodowania. Po pierwsze, nie wszystkie 64 kodony mogą być zaangażowane w kodowanie 20 aminokwasów, ale tylko 20, a po drugie, aminokwasy mogą być kodowane przez kilka kodonów. Badania wykazały, że natura wybrała tę drugą opcję.

Jego preferencje są jasne. Gdyby tylko 20 z 64 wariantów tripletów było zaangażowanych w kodowanie aminokwasów, wówczas 44 triplety (z 64) pozostałyby niekodujące, tj. bezsensowne (bezsensowne kodony). Wcześniej zwracaliśmy uwagę, jak niebezpieczne dla życia komórki jest przekształcenie tripletu kodującego w wyniku mutacji w kodon nonsensowny – powoduje to w znaczący sposób zakłócenie normalnej pracy polimerazy RNA, ostatecznie prowadząc do rozwoju chorób. Obecnie w naszym genomie znajdują się trzy kodony nonsensowne, a teraz wyobraźmy sobie, co by się stało, gdyby liczba kodonów nonsensownych wzrosła około 15 razy. Jest oczywiste, że w takiej sytuacji przejście kodonów normalnych do kodonów nonsensownych będzie nieporównywalnie wyższe.

Kod, w którym jeden aminokwas jest kodowany przez kilka trójek, nazywa się zdegenerowanym lub zbędnym. Prawie każdy aminokwas ma kilka kodonów. Zatem aminokwas leucyna może być kodowany przez sześć trójek - UUA, UUG, CUU, CUC, CUA, CUG. Walina jest kodowana przez cztery trójki, fenyloalanina przez dwie i tylko tryptofan i metionina kodowane przez jeden kodon. Właściwość związana z zapisywaniem tej samej informacji przy użyciu różnych znaków nazywa się degeneracja.

Liczba kodonów przypisanych do jednego aminokwasu dobrze koreluje z częstotliwością występowania aminokwasu w białkach.

I najprawdopodobniej nie jest to przypadkowe. Im większa częstotliwość występowania aminokwasu w białku, im częściej kodon tego aminokwasu występuje w genomie, tym większe jest prawdopodobieństwo jego uszkodzenia przez czynniki mutagenne. Dlatego jasne jest, że zmutowany kodon z większym prawdopodobieństwem koduje ten sam aminokwas, jeśli jest wysoce zdegenerowany. Z tych pozycji degeneracja kodu genetycznego jest mechanizmem chroniącym ludzki genom przed uszkodzeniem.

Należy zauważyć, że termin „degeneracja” jest używany w genetyce molekularnej także w innym znaczeniu. Ponieważ główna część informacji w kodonie przypada na pierwsze dwa nukleotydy, zasada na trzeciej pozycji kodonu okazuje się mało istotna. Zjawisko to nazywa się „degeneracją trzeciej podstawy”. Ta ostatnia cecha minimalizuje wpływ mutacji. Wiadomo na przykład, że główną funkcją czerwonych krwinek jest transport tlenu z płuc do tkanek i dwutlenku węgla z tkanek do płuc. Funkcję tę pełni pigment oddechowy - hemoglobina, która wypełnia całą cytoplazmę erytrocytu. Składa się z części białkowej – globiny, która jest kodowana przez odpowiedni gen. Oprócz białka hemoglobina zawiera hem, który zawiera żelazo. Mutacje w genach globiny prowadzą do pojawienia się różnych wariantów hemoglobiny. Najczęściej mutacje są związane z podstawienie jednego nukleotydu na inny i pojawienie się nowego kodonu w genie, który może kodować nowy aminokwas w łańcuchu polipeptydowym hemoglobiny. W triplecie w wyniku mutacji można zastąpić dowolny nukleotyd - pierwszy, drugi lub trzeci. Wiadomo, że kilkaset mutacji wpływa na integralność genów globiny. W pobliżu 400 z których związane są z zastąpieniem pojedynczych nukleotydów w genie i odpowiadającym podstawieniem aminokwasu w polipeptydzie. Z tych tylko 100 podstawienia prowadzą do niestabilności hemoglobiny i różnego rodzaju chorób od łagodnych do bardzo ciężkich. 300 (około 64%) mutacji substytucyjnych nie wpływa na funkcję hemoglobiny i nie prowadzi do patologii. Jedną z przyczyn tego jest wspomniana powyżej „degeneracja trzeciej zasady”, gdy zastąpienie trzeciego nukleotydu w triplecie kodującym serynę, leucynę, prolinę, argininę i niektóre inne aminokwasy prowadzi do pojawienia się kodonu synonimowego kodujące ten sam aminokwas. Fenotypowo taka mutacja nie ujawni się. Natomiast jakakolwiek wymiana pierwszego lub drugiego nukleotydu w trójce w 100% przypadków prowadzi do pojawienia się nowego wariantu hemoglobiny. Ale nawet w tym przypadku mogą nie wystąpić poważne zaburzenia fenotypowe. Powodem tego jest zastąpienie aminokwasu w hemoglobinie innym, podobnym do pierwszego pod względem właściwości fizykochemicznych. Na przykład, jeśli aminokwas o właściwościach hydrofilowych zostanie zastąpiony innym aminokwasem, ale o tych samych właściwościach.

Hemoglobina składa się z grupy żelaza porfirynowego hemu (do którego przyłączone są cząsteczki tlenu i dwutlenku węgla) oraz białka - globiny. Hemoglobina u dorosłych (HbA) zawiera dwa identyczne- łańcuchy i dwa-więzy. Cząsteczka-łańcuch zawiera 141 reszt aminokwasowych,- łańcuch - 146,- I-łańcuchy różnią się wieloma resztami aminokwasowymi. Sekwencja aminokwasowa każdego łańcucha globiny jest kodowana przez jego własny gen. Kodowanie genu- łańcuch znajduje się na krótkim ramieniu chromosomu 16,-gen - w krótkim ramieniu chromosomu 11. Zmiana w kodowaniu genu- łańcuch hemoglobiny pierwszego lub drugiego nukleotydu prawie zawsze prowadzi do pojawienia się nowych aminokwasów w białku, zakłócenia funkcji hemoglobiny i poważnych konsekwencji dla pacjenta. Przykładowo zastąpienie „C” w jednej z trójek CAU (histydyny) literą „U” doprowadzi do pojawienia się nowej trójki UAU kodującej inny aminokwas – tyrozynę. Fenotypowo przejawi się to poważną chorobą.. A podobny zamiennik w pozycji 63-łańcuch polipeptydu histydynowego do tyrozyny powoduje destabilizację hemoglobiny. Rozwija się choroba methemoglobinemia. Zmiana w wyniku mutacji kwasu glutaminowego na walinę na 6 pozycjiłańcuch jest przyczyną ciężkiej choroby - anemii sierpowatokrwinkowej. Nie kontynuujmy smutnej listy. Zauważamy tylko, że zastępując pierwsze dwa nukleotydy, aminokwas może wydawać się podobny pod względem właściwości fizykochemicznych do poprzedniego. Zatem zastąpienie drugiego nukleotydu w jednej z trójek kodujących kwas glutaminowy (GAA) w-łańcuch na „Y” prowadzi do pojawienia się nowego tripletu (GUA) kodującego walinę, a zastąpienie pierwszego nukleotydu przez „A” tworzy triplet AAA kodujący aminokwas lizynę. Kwas glutaminowy i lizyna mają podobne właściwości fizykochemiczne - oba są hydrofilowe. Walina jest aminokwasem hydrofobowym. Dlatego zastąpienie hydrofilowego kwasu glutaminowego hydrofobową waliną znacząco zmienia właściwości hemoglobiny, co ostatecznie prowadzi do rozwoju anemii sierpowatokrwinkowej, natomiast zastąpienie hydrofilowego kwasu glutaminowego hydrofilową lizyną w mniejszym stopniu zmienia funkcję hemoglobiny – pacjenci rozwinie się łagodna postać anemii. W wyniku zamiany trzeciej zasady, nowa trójka może kodować te same aminokwasy, co poprzednia. Na przykład, jeśli uracyl został zastąpiony cytozyną w triplecie CAH i powstał triplet CAC, wówczas praktycznie nie zostaną wykryte żadne zmiany fenotypowe u danej osoby. Jest to zrozumiałe, ponieważ Obie trójki kodują ten sam aminokwas, histydynę.

Podsumowując, należy podkreślić, że degeneracja kodu genetycznego i degeneracja trzeciej zasady z ogólnego biologicznego punktu widzenia są mechanizmami ochronnymi, które ewolucja wpisuje w unikalną strukturę DNA i RNA.

V. Jednoznaczność.

Każda trójka (z wyjątkiem trójek bez znaczenia) koduje tylko jeden aminokwas. Zatem w kierunku kodon - aminokwas kod genetyczny jest jednoznaczny, w kierunku aminokwas - kodon - jest niejednoznaczny (zdegenerowany).

niedwuznaczny

kodon, aminokwas

zdegenerowany

I w tym przypadku potrzeba jednoznaczności w kodzie genetycznym jest oczywista. W innym wariancie podczas translacji tego samego kodonu do łańcucha białkowego zostaną wstawione różne aminokwasy, w wyniku czego powstaną białka o różnych strukturach pierwszorzędowych i różnych funkcjach. Metabolizm komórki przestawiłby się na tryb działania „jeden gen – kilka polipeptydów”. Jest oczywiste, że w takiej sytuacji funkcja regulacyjna genów zostałaby całkowicie utracona.

g. Polaryzacja

Odczyt informacji z DNA i mRNA następuje tylko w jednym kierunku. Polaryzacja jest niezbędna do definiowania struktur wyższego rzędu (wtórnych, trzeciorzędnych itp.). Wcześniej mówiliśmy o tym, że struktury niższego rzędu determinują struktury wyższego rzędu. Struktura trzeciorzędowa i struktury wyższego rzędu w białkach powstają natychmiast, gdy zsyntetyzowany łańcuch RNA odsunie się od cząsteczki DNA lub łańcuch polipeptydowy odsunie się od rybosomu. Podczas gdy wolny koniec RNA lub polipeptydu uzyskuje strukturę trzeciorzędową, drugi koniec łańcucha nadal jest syntetyzowany na DNA (w przypadku transkrypcji RNA) lub rybosomie (w przypadku transkrypcji polipeptydu).

Dlatego jednokierunkowy proces odczytu informacji (w syntezie RNA i białka) jest niezbędny nie tylko do ustalenia sekwencji nukleotydów czy aminokwasów w syntetyzowanej substancji, ale także do sztywnego określenia drugorzędowego, trzeciorzędowego itp. Struktury.

e. Brak nakładania się.

Kod może, ale nie musi, nakładać się na siebie. W większości organizmów kod nie nakłada się. W niektórych fagach odkryto nakładający się kod.

Istota kodu niezachodzącego na siebie polega na tym, że nukleotyd jednego kodonu nie może być jednocześnie nukleotydem innego kodonu. Jeżeli kody nakładałyby się, wówczas sekwencja siedmiu nukleotydów (GCUGCUG) mogłaby kodować nie dwa aminokwasy (alanina-alanina) (ryc. 33, A) jak w przypadku kodu niezachodzącego na siebie, ale trzy (jeśli jeden nukleotyd jest powszechny) (ryc. 33, B) lub pięć (jeśli wspólne są dwa nukleotydy) (patrz ryc. 33, C). W dwóch ostatnich przypadkach mutacja dowolnego nukleotydu doprowadziłaby do naruszenia sekwencji dwóch, trzech itd. aminokwasy.

Jednakże odkryto, że mutacja jednego nukleotydu zawsze zakłóca włączenie jednego aminokwasu do polipeptydu. Jest to istotny argument przemawiający za tym, że kod się nie nakłada.

Wyjaśnijmy to na rysunku 34. Pogrubione linie pokazują trójki kodujące aminokwasy w przypadku kodu nienakładającego się i nakładającego się. Eksperymenty jednoznacznie wykazały, że kod genetyczny nie nakłada się. Nie wchodząc w szczegóły eksperymentu, zauważamy, że jeśli zastąpimy trzeci nukleotyd w sekwencji nukleotydów (patrz ryc. 34)Na (oznaczone gwiazdką) na inny, to:

1. W przypadku niezachodzącego na siebie kodu białko kontrolowane przez tę sekwencję mogłoby zastąpić jeden (pierwszy) aminokwas (oznaczony gwiazdkami).

2. W przypadku nakładającego się kodu w opcji A, zamiana nastąpi w dwóch (pierwszym i drugim) aminokwasach (oznaczonych gwiazdkami). W opcji B podstawienie będzie miało wpływ na trzy aminokwasy (oznaczone gwiazdkami).

Jednakże liczne eksperymenty wykazały, że w przypadku uszkodzenia jednego nukleotydu w DNA, białko zawsze oddziałuje tylko na jeden aminokwas, co jest typowe dla kodu niezachodzącego na siebie.

ГЦУГЦУГ ГЦУГЦУГ ГЦУГЦУГ

HCC HCC HCC UHC CUG HCC CUG UGC HCC CUG

*** *** *** *** *** ***

Alanina - Alanina Ala - Cys - Lei Ala - Lei - Lei - Ala - Lei

A B C

nienakładający się kod nakładający się kod

Ryż. 34. Schemat wyjaśniający obecność nienakładającego się kodu w genomie (objaśnienie w tekście).

Nienakładanie się kodu genetycznego wiąże się z jeszcze jedną właściwością – odczytywanie informacji rozpoczyna się od pewnego momentu – sygnału inicjującego. Takim sygnałem inicjacji w mRNA jest kodon kodujący metioninę AUG.

Należy zauważyć, że dana osoba nadal ma niewielką liczbę genów, które odbiegają od ogólnej zasady i nakładają się.

e. Zwartość.

Pomiędzy kodonami nie ma znaków interpunkcyjnych. Inaczej mówiąc, trojaczki nie są od siebie oddzielone np. jednym nic nie znaczącym nukleotydem. Eksperymentalnie udowodniono brak „znaków interpunkcyjnych” w kodzie genetycznym.

I. Wszechstronność.

Kod jest taki sam dla wszystkich organizmów żyjących na Ziemi. Bezpośredni dowód uniwersalności kodu genetycznego uzyskano poprzez porównanie sekwencji DNA z odpowiadającymi im sekwencjami białek. Okazało się, że we wszystkich genomach bakterii i eukariotów stosowane są te same zestawy wartości kodowych. Są wyjątki, ale nie jest ich wiele.

Pierwsze wyjątki od uniwersalności kodu genetycznego znaleziono w mitochondriach niektórych gatunków zwierząt. Dotyczyło to kodonu terminatora UGA, którego odczyt był taki sam jak kodonu UGG kodującego aminokwas tryptofan. Stwierdzono również inne, rzadsze odchylenia od uniwersalności.

System kodu DNA.

Kod genetyczny DNA składa się z 64 trójek nukleotydów. Te trojaczki nazywane są kodonami. Każdy kodon koduje jeden z 20 aminokwasów używanych w syntezie białek. Daje to pewną redundancję w kodzie: większość aminokwasów jest kodowana przez więcej niż jeden kodon.
Jeden kodon pełni dwie powiązane ze sobą funkcje: sygnalizuje początek translacji i koduje włączenie aminokwasu metioniny (Met) do rosnącego łańcucha polipeptydowego. System kodu DNA jest zaprojektowany w taki sposób, że kod genetyczny może być wyrażany albo jako kodony RNA, albo jako kodony DNA. Kodony RNA występują w RNA (mRNA) i kodony te są w stanie odczytać informacje podczas syntezy polipeptydów (proces zwany translacją). Ale każda cząsteczka mRNA nabywa sekwencję nukleotydową w transkrypcji z odpowiedniego genu.

Wszystkie aminokwasy z wyjątkiem dwóch (Met i Trp) mogą być kodowane przez 2 do 6 różnych kodonów. Jednakże genom większości organizmów pokazuje, że niektóre kodony są faworyzowane w stosunku do innych. Na przykład u ludzi alanina jest kodowana przez GCC cztery razy częściej niż w GCG. Prawdopodobnie wskazuje to na większą wydajność translacji aparatu translacyjnego (np. rybosomu) dla niektórych kodonów.

Kod genetyczny jest niemal uniwersalny. Te same kodony są przypisane do tego samego odcinka aminokwasów, a te same sygnały startu i stopu są w przeważającej mierze takie same u zwierząt, roślin i mikroorganizmów. Znaleziono jednak pewne wyjątki. Większość z nich polega na przypisaniu jednego lub dwóch z trzech kodonów stop do aminokwasu.

Kod genetyczny to sposób kodowania sekwencji aminokwasów w cząsteczce białka przy użyciu sekwencji nukleotydów w cząsteczce kwasu nukleinowego. Właściwości kodu genetycznego wynikają z cech tego kodowania.

Każdy aminokwas białka jest powiązany z trzema kolejnymi nukleotydami kwasu nukleinowego - tryplet, Lub kodon. Każdy z nukleotydów może zawierać jedną z czterech zasad azotowych. W RNA tak adenina(A) uracyl(U) guanina(G) cytozyna(C). Łącząc na różne sposoby zasady azotowe (w tym przypadku zawierające je nukleotydy), można uzyskać wiele różnych trójek: AAA, GAU, UCC, GCA, AUC itp. Całkowita liczba możliwych kombinacji wynosi 64, tj. 4 3 .

Białka organizmów żywych zawierają około 20 aminokwasów. Gdyby natura „wymyśliła” kodowanie każdego aminokwasu nie trzema, ale dwoma nukleotydami, wówczas różnorodność takich par nie byłaby wystarczająca, ponieważ byłoby ich tylko 16, tj. 4 2 .

Zatem, główną właściwością kodu genetycznego jest jego triplet. Każdy aminokwas jest kodowany przez triplet nukleotydów.

Ponieważ istnieje znacznie więcej możliwych różnych trójek niż aminokwasy stosowane w cząsteczkach biologicznych, taka właściwość jak nadmierność kod genetyczny. Wiele aminokwasów zaczęto kodować nie przez jeden kodon, ale przez kilka. Na przykład aminokwas glicyna jest kodowany przez cztery różne kodony: GGU, GGC, GGA, GGG. Redundancja jest również nazywana degeneracja.

Zależność pomiędzy aminokwasami i kodonami jest odzwierciedlona w formie tabel. Na przykład te:

W odniesieniu do nukleotydów kod genetyczny ma następującą właściwość: wyjątkowość(Lub specyficzność): każdy kodon odpowiada tylko jednemu aminokwasowi. Na przykład kodon GGU może kodować tylko glicynę i żaden inny aminokwas.

Ponownie. Redundancja polega na tym, że kilka trójek może kodować ten sam aminokwas. Specyficzność – każdy specyficzny kodon może kodować tylko jeden aminokwas.

W kodzie genetycznym nie ma specjalnych znaków interpunkcyjnych (z wyjątkiem kodonów stop, które wskazują koniec syntezy polipeptydu). Funkcję znaków interpunkcyjnych pełnią same trójki - koniec jednej oznacza, że ​​następna zacznie się kolejna. Oznacza to następujące dwie właściwości kodu genetycznego: ciągłość I nie nakładające się. Przez ciągłość rozumie się odczytywanie trójek bezpośrednio jedna po drugiej. Brak nakładania się oznacza, że ​​każdy nukleotyd może być częścią tylko jednej trójki. Zatem pierwszy nukleotyd następnego tripletu zawsze następuje po trzecim nukleotydzie poprzedniego tripletu. Kodon nie może zaczynać się od drugiego lub trzeciego nukleotydu poprzedniego kodonu. Innymi słowy, kod nie nakłada się.

Kod genetyczny ma tę właściwość uniwersalność. To samo dotyczy wszystkich organizmów na Ziemi, co wskazuje na jedność pochodzenia życia. Istnieją od tego bardzo rzadkie wyjątki. Na przykład niektóre trojaczki mitochondriów i chloroplastów kodują aminokwasy inne niż ich zwykłe aminokwasy. Może to wskazywać, że u zarania rozwoju życia istniały nieco inne odmiany kodu genetycznego.

Wreszcie kod genetyczny tak ma odporność na hałas, co jest konsekwencją jego własności jako redundancji. Mutacje punktowe, czasami występujące w DNA, zwykle skutkują zastąpieniem jednej zasady azotowej inną. To zmienia trójkę. Na przykład było to AAA, po mutacji stało się AAG. Jednak takie zmiany nie zawsze prowadzą do zmiany aminokwasu w syntetyzowanym polipeptydzie, ponieważ obydwie trójki, ze względu na właściwość redundancji kodu genetycznego, mogą odpowiadać jednemu aminokwasowi. Biorąc pod uwagę, że mutacje są częściej szkodliwe, przydatna jest właściwość odporności na szum.