Kod genetyczny i jego właściwości to historia odkryć. Kod genetyczny jako sposób zapisu informacji dziedzicznej

Cykl artykułów opisujących genezę Kodeksu cywilnego można potraktować jako śledztwo w sprawie wydarzeń, po których zachowało się wiele śladów. Jednak zrozumienie tych artykułów wymaga pewnego wysiłku, aby zrozumieć molekularne mechanizmy syntezy białek. Artykuł ten jest wstępem do cyklu autopublikacji poświęconych pochodzeniu kodu genetycznego i jest najlepszym miejscem do rozpoczęcia zapoznania się z tym tematem.
Zazwyczaj kod genetyczny(GC) definiuje się jako metodę (regułę) kodowania białka w strukturze pierwszorzędowej DNA lub RNA. W literaturze najczęściej pisze się, że jest to unikalna zgodność sekwencji trzech nukleotydów w genie z jednym aminokwasem w syntetyzowanym białku lub punktem końcowym syntezy białka. Definicja ta zawiera jednak dwa błędy. Odnosi się to do 20 tak zwanych aminokwasów kanonicznych, które wchodzą w skład białek wszystkich bez wyjątku żywych organizmów. Aminokwasy te są monomerami białkowymi. Błędy są następujące:

1) Nie ma 20 aminokwasów kanonicznych, ale tylko 19. Aminokwas możemy nazwać substancją, która zawiera jednocześnie grupę aminową -NH2 i grupę karboksylową - COOH. Faktem jest, że monomer białka - prolina - nie jest aminokwasem, ponieważ zawiera grupę iminową zamiast grupy aminowej, dlatego bardziej poprawne jest nazywanie proliny iminokwasem. Jednak w przyszłości we wszystkich artykułach poświęconych HA dla wygody napiszę około 20 aminokwasów, co sugeruje określony niuans. Struktury aminokwasów pokazano na ryc. 1.

Ryż. 1. Struktury aminokwasów kanonicznych. Aminokwasy mają części stałe, zaznaczone na rysunku kolorem czarnym i części zmienne (lub rodniki), zaznaczone na czerwono.

2) Zgodność aminokwasów z kodonami nie zawsze jest jednoznaczna. Informacje na temat naruszenia przypadków jednoznaczności można znaleźć poniżej.

Pojawienie się GC oznacza pojawienie się kodowanej syntezy białek. To wydarzenie jest jednym z kluczowych wydarzeń dla ewolucyjnego powstawania pierwszych żywych organizmów.

Strukturę HA przedstawiono w formie kołowej na ryc. 2.



Ryż. 2. Kod genetyczny w okrągłym kształcie. Wewnętrzny okrąg to pierwsza litera kodonu, druga koło - druga litera kodonu, trzecie kółko - trzecia litera kodonu, czwarte kółko - oznaczenie aminokwasów w trzyliterowym skrócie; P – aminokwasy polarne, NP – aminokwasy niepolarne. Dla przejrzystości symetrii ważny jest wybrany porządek symboli U - C - A - G .

Zacznijmy więc opisywać główne właściwości HA.

1. Potrójność. Każdy aminokwas jest kodowany przez sekwencję trzech nukleotydów.

2. Obecność międzygenowych znaków interpunkcyjnych. Międzygenowe znaki interpunkcyjne obejmują sekwencje kwasów nukleinowych, w których rozpoczyna się lub kończy translacja.

Tłumaczenie nie może rozpocząć się od żadnego kodonu, ale tylko od ściśle określonego - startowy. Kodon start zawiera triplet AUG, od którego rozpoczyna się translacja. W tym przypadku triplet ten koduje albo metioninę, albo inny aminokwas – formylometioninę (u prokariotów), który można włączyć dopiero na początku syntezy białek. Na końcu każdego genu kodującego polipeptyd znajduje się co najmniej jeden z 3 kodony stop, Lub światła stopu: UAA, UAG, UGA. Kończą translację (tzw. syntezę białek na rybosomie).

3. Zwartość lub brak wewnątrzgenowych znaków interpunkcyjnych. W genie każdy nukleotyd jest częścią znaczącego kodonu.

4. Nie nakładające się. Kodony nie nakładają się na siebie; każdy ma swój własny uporządkowany zestaw nukleotydów, który nie pokrywa się z podobnymi zestawami sąsiednich kodonów.

5. Degeneracja. Odwrotna zgodność w kierunku aminokwas-kodon jest niejednoznaczna. Ta właściwość nazywa się degeneracją. Seria to zestaw kodonów kodujących jeden aminokwas, innymi słowy, jest to grupa równoważne kodony. Pomyślmy o kodonie jako o XYZ. Jeśli XY określa „sens” (tj. aminokwas), wówczas nazywany jest kodonem mocny. Jeśli do określenia znaczenia kodonu potrzebny jest określony Z, wówczas nazywa się taki kodon słaby.

Degeneracja kodu jest ściśle związana z niejednoznacznością parowania kodon-antykodon (antykodon oznacza sekwencję trzech nukleotydów na tRNA, która może komplementarnie łączyć się z kodonem na informacyjnym RNA (więcej szczegółów na ten temat można znaleźć w dwóch artykułach: Molekularne mechanizmy zapewniające degenerację kodu I Reguła Lagerquista. Fizykochemiczne uzasadnienie symetrii i zależności Rumera). Jeden antykodon na tRNA może rozpoznać od jednego do trzech kodonów na mRNA.

6.Jednoznaczność. Każdy triplet koduje tylko jeden aminokwas lub jest terminatorem translacji.

Istnieją trzy znane wyjątki.

Pierwszy. U prokariotów na pierwszej pozycji (duża litera) koduje formylometioninę, a na każdej innej pozycji metioninę.Na początku genu formylometionina jest kodowana zarówno przez zwykły kodon metioniny AUG, jak i kodon waliny GUG lub leucyna UUG , które w obrębie genu kodują odpowiednio walinę i leucynę .

W wielu białkach formylometionina ulega rozszczepieniu lub usunięciu grupy formylowej, w wyniku czego formylometionina zostaje przekształcona w zwykłą metioninę.

Drugi. W 1986 roku kilka grup badaczy odkryło, że kodon stop UGA na mRNA może kodować selenocysteinę (patrz ryc. 3), pod warunkiem, że następuje po nim specjalna sekwencja nukleotydów.

Ryż. 3. Struktura 21. aminokwasu – selenocysteiny.

U E coli(to łacińska nazwa Escherichia coli) selenocysteylo-tRNA podczas translacji rozpoznaje kodon UGA w mRNA, ale tylko w pewnym kontekście: aby kodon UGA został uznany za znaczący, sekwencja o długości 45 nukleotydów zlokalizowana po UGA kodon jest ważny.

Rozważany przykład pokazuje, że w razie potrzeby żywy organizm może zmienić znaczenie standardowego kodu genetycznego. W tym przypadku informacja genetyczna zawarta w genach jest kodowana w sposób bardziej złożony. Znaczenie kodonu określa się w kontekście określonej, wydłużonej sekwencji nukleotydowej i przy udziale kilku wysoce specyficznych czynników białkowych. Ważne jest, że tRNA selenocysteiny znaleziono u przedstawicieli wszystkich trzech gałęzi życia (archeonów, eubakterii i eukariontów), co wskazuje na starożytne pochodzenie syntezy selenocysteiny i jej możliwą obecność u ostatniego uniwersalnego wspólnego przodka (co będzie omówimy w innych artykułach). Najprawdopodobniej selenocysteina występuje we wszystkich żywych organizmach bez wyjątku. Ale w każdym organizmie selenocysteina występuje w nie więcej niż kilkudziesięciu białkach. Wchodzi w skład aktywnych centrów enzymów, w szeregu homologów, których zwykła cysteina może funkcjonować na podobnej pozycji.

Do niedawna uważano, że kodon UGA można odczytać albo jako selenocysteinę, albo jako terminal, jednak ostatnio wykazano, że u orzęsków Euplotes Kodon UGA koduje cysteinę lub selenocysteinę. Cm. " Kod genetyczny pozwala na rozbieżności”

Trzeci wyjątek. Niektóre prokarioty (5 gatunków archeonów i jedna eubakteria - informacje na Wikipedii są bardzo nieaktualne) zawierają specjalny kwas - pirolizynę (ryc. 4). Jest kodowany przez trójkę UAG, która w kodzie kanonicznym służy jako terminator translacji. Zakłada się, że w tym przypadku, podobnie jak w przypadku kodowania selenocysteiny, odczyt UAG jako kodonu pirolizynowego następuje ze względu na specjalną strukturę na mRNA. tRNA pirolizyny zawiera antykodon CTA i jest aminoacylowany przez ARSazy klasy 2 (klasyfikacja ARSaz znajduje się w artykule „Kodazy pomagają zrozumieć, w jaki sposób kod genetyczny ").

UAG jest rzadko używany jako kodon stop, a gdy jest używany, często następuje po nim inny kodon stop.

Ryż. 4. Struktura 22. aminokwasu pirolizyny.

7. Wszechstronność. Po zakończeniu rozszyfrowania Kodeksu cywilnego w połowie lat 60. ubiegłego wieku przez długi czas uważano, że kod jest taki sam we wszystkich organizmach, co wskazuje na jedność pochodzenia wszelkiego życia na Ziemi.

Spróbujmy zrozumieć, dlaczego Kodeks cywilny jest uniwersalny. Faktem jest, że gdyby w organizmie zmieniła się przynajmniej jedna zasada kodowania, doprowadziłoby to do zmiany w strukturze znacznej części białek. Taka zmiana byłaby zbyt drastyczna i dlatego prawie zawsze śmiertelna, ponieważ zmiana znaczenia tylko jednego kodonu może dotyczyć średnio 1/64 wszystkich sekwencji aminokwasowych.

Prowadzi to do jednego bardzo ważnego wniosku: GC prawie się nie zmieniła od czasu swojego powstania ponad 3,5 miliarda lat temu. Oznacza to, że w jego strukturze znajduje się ślad pochodzenia, a analiza tej struktury może pomóc w dokładnym zrozumieniu, w jaki sposób mogła powstać GC.

W rzeczywistości HA może różnić się nieco pod względem bakterii, mitochondriów, kodu jądrowego niektórych orzęsków i drożdży. Obecnie istnieje co najmniej 17 kodów genetycznych różniących się od kanonicznego kodonami 1-5. W sumie we wszystkich znanych wariantach odchyleń od uniwersalnego GK stosuje się 18 różnych podstawień znaczenia kodonu. Najwięcej odchyleń od standardowego kodu znane jest dla mitochondriów - 10. Warto zauważyć, że mitochondria kręgowców, płazińców i szkarłupni kodowane są różnymi kodami, podczas gdy grzyby pleśniowe, pierwotniaki i koelenteraty kodowane są jednym.

Ewolucyjna bliskość gatunków wcale nie gwarantuje, że mają one podobne GC. Kody genetyczne mogą się różnić nawet pomiędzy różnymi gatunkami mykoplazm (niektóre gatunki mają kod kanoniczny, inne zaś rozbieżny). Podobną sytuację obserwuje się w przypadku drożdży.

Należy zauważyć, że mitochondria są potomkami organizmów symbiotycznych, które przystosowały się do życia wewnątrz komórek. Mają znacznie zredukowany genom; niektóre geny przeniosły się do jądra komórkowego. Dlatego zmiany w HA w nich nie są już tak dramatyczne.

Wyjątki odkryte później są szczególnie interesujące z ewolucyjnego punktu widzenia, ponieważ mogą pomóc rzucić światło na mechanizmy ewolucji kodu.

Tabela 1.

Kody mitochondrialne w różnych organizmach.

Kodon

Kod uniwersalny

Kody mitochondrialne

Kręgowce

Bezkręgowce

Drożdże

Rośliny

UGA

ZATRZYMYWAĆ SIĘ

Trp

Trp

Trp

ZATRZYMYWAĆ SIĘ

AUA

Ile

Spotkał

Spotkał

Spotkał

Ile

CUA

Leja

Leja

Leja

Thr

Leja

AGA.

Argument

ZATRZYMYWAĆ SIĘ

Ser

Argument

Argument

AGG

Argument

ZATRZYMYWAĆ SIĘ

Ser

Argument

Argument

Trzy mechanizmy zmiany aminokwasu kodowanego przez kod.

Pierwsza ma miejsce, gdy pewien kodon nie jest używany (lub prawie nie jest używany) przez jakiś organizm z powodu nierównomiernego występowania niektórych nukleotydów (skład GC) lub kombinacji nukleotydów. W rezultacie taki kodon może całkowicie zniknąć z użycia (np. z powodu utraty odpowiedniego tRNA), a później można go wykorzystać do zakodowania innego aminokwasu, nie powodując przy tym znaczących uszkodzeń organizmu. Mechanizm ten może być odpowiedzialny za pojawienie się niektórych dialektów kodowych w mitochondriach.

Drugim jest przekształcenie kodonu stop w sens komórki jajowej. W takim przypadku niektóre z przetłumaczonych białek mogą zawierać dodatki. Jednak sytuację częściowo ratuje fakt, że wiele genów często kończy się nie jednym, ale dwoma kodonami stop, ponieważ możliwe są błędy translacyjne, w których kodony stop są odczytywane jako aminokwasy.

Trzecim jest możliwość niejednoznacznego odczytania pewnych kodonów, jak ma to miejsce w przypadku niektórych grzybów.

8 . Łączność. Nazywa się grupy równoważnych kodonów (to znaczy kodonów kodujących ten sam aminokwas). w serii. GC zawiera 21 serii, w tym kodony stop. Poniżej, dla pewności, zostanie wywołana dowolna grupa kodonów łączność, jeśli z każdego kodonu tej grupy można przejść do wszystkich innych kodonów tej samej grupy poprzez kolejne podstawienia nukleotydów. Z 21 serii połączonych jest 18. 2 serie zawierają po jednym kodonie każdy i tylko 1 seria dla aminokwasu seryny jest niepołączona i dzieli się na dwie połączone podserie.


Ryż. 5. Wykresy łączności dla niektórych serii kodów. a - połączony szereg waliny; b - połączone serie leucyny; Seria seryny jest niespójna i dzieli się na dwie połączone podserie. Rysunek pochodzi z artykułu V.A. Ratnera” Kod genetyczny jak system.”

Właściwość łączności można wytłumaczyć faktem, że w okresie tworzenia GC wychwytywała nowe kodony, które minimalnie różniły się od już używanych.

9. Regularność właściwości aminokwasów na podstawie korzeni trojaczków. Wszystkie aminokwasy kodowane przez triplety rdzenia U są niepolarne, nie mają ekstremalnych właściwości i rozmiarów oraz mają rodniki alifatyczne. Wszystkie trojaczki z korzeniem C mają mocne zasady, a kodowane przez nie aminokwasy są stosunkowo małe. Wszystkie trojaczki z korzeniem A mają słabe zasady i kodują polarne aminokwasy o niemałym rozmiarze. Kodony z rdzeniem G charakteryzują się ekstremalnymi i anomalnymi wariantami aminokwasów i serii. Kodują najmniejszy aminokwas (glicynę), najdłuższy i najbardziej płaski (tryptofan), najdłuższy i najbardziej sękaty (arginina), najbardziej reaktywny (cysteina) i tworzą anomalną podserię seryny.

10. Blokowość. Powszechny Kodeks Cywilny jest kodem „blokowym”. Oznacza to, że aminokwasy o podobnych właściwościach fizykochemicznych kodowane są przez kodony różniące się od siebie jedną zasadą. Blokowy charakter kodu jest wyraźnie widoczny na poniższym rysunku.


Ryż. 6. Struktura blokowa Kodeksu cywilnego. Aminokwasy z grupą alkilową zaznaczono kolorem białym.


Ryż. 7. Kolorowe przedstawienie właściwości fizykochemicznych aminokwasów na podstawie wartości opisanych w książceStyers „Biochemia”. Po lewej stronie jest hydrofobowość. Po prawej stronie widać zdolność do tworzenia helisy alfa w białku. Kolory czerwony, żółty i niebieski wskazują aminokwasy o wysokiej, średniej i niskiej hydrofobowości (po lewej) lub odpowiadającym stopniu zdolności do tworzenia helisy alfa (po prawej).

Właściwość blokowości i regularności można również wytłumaczyć faktem, że w okresie tworzenia GC wychwytywała nowe kodony, które minimalnie różniły się od już używanych.

Kodony o tych samych pierwszych zasadach (przedrostki kodonów) kodują aminokwasy o podobnych szlakach biosyntezy. Kodony aminokwasów należących do rodzin szikimianowych, pirogronianowych, asparaginianowych i glutaminianowych mają odpowiednio przedrostki U, G, A i C. O ścieżkach starożytnej biosyntezy aminokwasów i jej powiązaniu z właściwościami współczesnego kodu zob. „Starożytny dublet kod genetyczny zostało z góry określone przez szlaki syntezy aminokwasów. Na podstawie tych danych niektórzy badacze dochodzą do wniosku, że na powstanie kodu duży wpływ miały biosyntetyczne relacje między aminokwasami. Jednak podobieństwo szlaków biosyntezy wcale nie oznacza podobieństwa właściwości fizykochemicznych.

11. Odporność na hałas. W najbardziej ogólnej formie odporność HA na szum oznacza, że ​​przy przypadkowych mutacjach punktowych i błędach translacyjnych właściwości fizykochemiczne aminokwasów nie zmieniają się zbytnio.

Zastąpienie jednego nukleotydu w triplecie w większości przypadków albo nie prowadzi do zmiany kodowanego aminokwasu, albo prowadzi do zmiany na aminokwas o tej samej polarności.

Jednym z mechanizmów zapewniających odporność GC na zakłócenia jest jego degeneracja. Średnia degeneracja jest równa liczbie zakodowanych sygnałów/całkowitej liczbie kodonów, gdzie zakodowane sygnały obejmują 20 aminokwasów i znak zakończenia translacji. Średnia degeneracja dla wszystkich aminokwasów i znaku terminacji wynosi trzy kodony na zakodowany sygnał.

Aby określić ilościowo odporność na zakłócenia, wprowadzamy dwie koncepcje. Nazywa się mutacje podstawienia nukleotydów, które nie prowadzą do zmiany klasy kodowanego aminokwasu konserwatywny. Nazywa się mutacje podstawień nukleotydowych prowadzące do zmiany klasy kodowanego aminokwasu rodnik .

Każda trójka pozwala na 9 pojedynczych podstawień. W sumie istnieje 61 trójek kodujących aminokwasy, dlatego liczba możliwych podstawień nukleotydowych dla wszystkich kodonów wynosi

61 x 9 = 549. Z tego:

23 podstawienia nukleotydów dają kodony stop.

134 podstawienia nie zmieniają kodowanego aminokwasu.
230 podstawień nie zmienia klasy kodowanego aminokwasu.
162 podstawienia prowadzą do zmiany klasy aminokwasów, tj. są radykalne.
Spośród 183 podstawień trzeciego nukleotydu 7 prowadzi do pojawienia się terminatorów translacji, a 176 jest konserwatywnych.
Spośród 183 podstawień pierwszego nukleotydu 9 prowadzi do pojawienia się terminatorów, 114 jest konserwatywnych, a 60 jest radykalnych.
Spośród 183 podstawień drugiego nukleotydu 7 prowadzi do pojawienia się terminatorów, 74 jest konserwatywnych, a 102 jest radykalnych.

Na podstawie tych obliczeń uzyskujemy ilościową ocenę odporności kodu na szumy jako stosunek liczby zastąpień konserwatywnych do liczby podstawień radykalnych. Jest to równe 364/162=2,25

Realistycznie oceniając udział degeneracji w odporności na hałas, należy wziąć pod uwagę częstotliwość występowania aminokwasów w białkach, która jest różna u różnych gatunków.

Jaki jest powód odporności kodu na zakłócenia? Większość badaczy uważa, że ​​właściwość ta jest konsekwencją wyboru alternatywnych GC.

Stephen Freeland i Lawrence Hurst wygenerowali losowo takie kody i odkryli, że tylko jeden na sto alternatywnych kodów był nie mniej odporny na zakłócenia niż kod uniwersalny.
Jeszcze bardziej interesujący fakt pojawił się, gdy badacze wprowadzili dodatkowe ograniczenie w celu uwzględnienia rzeczywistych trendów we wzorach mutacji DNA i błędów tłumaczeniowych. W takich warunkach TYLKO JEDEN KOD Z MILIONÓW MOŻLIWYCH okazał się lepszy od kodu kanonicznego.
Tę niespotykaną żywotność kodu genetycznego najłatwiej wytłumaczyć faktem, że powstał on w wyniku doboru naturalnego. Być może w świecie biologicznym istniało kiedyś wiele kodów, każdy z własną wrażliwością na błędy. Organizm, który lepiej sobie z nimi poradził, miał większe szanse na przeżycie, a kod kanoniczny po prostu wygrał walkę o byt. To założenie wydaje się całkiem realistyczne – wszak wiemy, że alternatywne kody naprawdę istnieją. Więcej informacji na temat odporności na zakłócenia można znaleźć w artykule Kodowana ewolucja (S. Freeland, L. Hirst „Zakodowana ewolucja”. // W świecie nauki. - 2004, nr 7).

Podsumowując, proponuję policzyć liczbę możliwych kodów genetycznych, które można wygenerować dla 20 aminokwasów kanonicznych. Z jakiegoś powodu nigdzie nie spotkałem tego numeru. Zatem potrzebujemy, aby wygenerowane GC zawierały 20 aminokwasów i sygnał stop, zakodowany przez CO NAJMNIEJ JEDEN KODON.

Ponumerujmy w myślach kodony w jakiejś kolejności. Będziemy rozumować w następujący sposób. Jeśli mamy dokładnie 21 kodonów, wówczas każdy aminokwas i sygnał stop będą zajmować dokładnie jeden kodon. W tym przypadku będzie 21 możliwych GC!

Jeśli kodonów jest 22, to pojawia się dodatkowy kodon, który może mieć jeden z dowolnych 21 zmysłów i kodon ten może znajdować się w dowolnym z 22 miejsc, natomiast pozostałe kodony mają dokładnie jeden inny sens, jak w przypadku 21 kodony. Otrzymujemy wówczas liczbę kombinacji 21!x(21x22).

Jeśli są 23 kodony, to rozumując podobnie, otrzymujemy, że 21 kodonów ma dokładnie jedno różne znaczenie każdy (21! opcji), a dwa kodony mają każdy po 21 różnych znaczeń (21 2 znaczeń ze STAŁĄ pozycją tych kodonów). Liczba różnych pozycji dla tych dwóch kodonów będzie wynosić 23x22. Całkowita liczba wariantów GC dla 23 kodonów wynosi 21!x21 2 x23x22

Jeśli są 24 kodony, liczba GC będzie wynosić 21!x21 3 x24x23x22,...

....................................................................................................................

Jeśli jest 64 kodonów, liczba możliwych GC będzie wynosić 21!x21 43 x64!/21! = 21 43 x 64! ~ 9,1x10 145

W metabolizmie organizmu Wiodącą rolę należy do białek i kwasów nukleinowych.
Substancje białkowe stanowią podstawę wszystkich ważnych struktur komórkowych, mają niezwykle wysoką reaktywność i są wyposażone w funkcje katalityczne.
Kwasy nukleinowe wchodzą w skład najważniejszego narządu komórki - jądra, a także cytoplazmy, rybosomów, mitochondriów itp. Kwasy nukleinowe odgrywają ważną, podstawową rolę w dziedziczności, zmienności organizmu i syntezie białek.

Plan synteza białko magazynowane jest w jądrze komórkowym, a bezpośrednia synteza zachodzi poza jądrem, więc jest konieczna Dostawa zakodowane plan z jądra do miejsca syntezy. Ta usługa dostarczania jest wykonywana przez cząsteczki RNA.

Proces rozpoczyna się o godz rdzeń komórki: część „drabiny” DNA rozwija się i otwiera. Dzięki temu litery RNA tworzą wiązania z otwartymi literami DNA jednej z nici DNA. Enzym przenosi litery RNA, aby połączyć je w nić. W ten sposób litery DNA są „przepisywane” na litery RNA. Nowo utworzony łańcuch RNA zostaje rozdzielony, a „drabina” DNA ponownie się skręca. Nazywa się proces odczytywania informacji z DNA i syntezy jej przy użyciu jego matrycy RNA transkrypcja , a zsyntetyzowany RNA nazywany jest przekaźnikiem lub mRNA .

Po dalszych modyfikacjach ten typ kodowanego mRNA jest gotowy. mRNA wychodzi z jądra i trafia do miejsca syntezy białka, gdzie rozszyfrowane są litery mRNA. Każdy zestaw trzech liter i-RNA tworzy „literę”, która reprezentuje jeden konkretny aminokwas.

Inny rodzaj RNA znajduje ten aminokwas, wychwytuje go za pomocą enzymu i dostarcza do miejsca syntezy białka. Ten RNA nazywany jest transferowym RNA lub t-RNA. W miarę odczytywania i translacji wiadomości mRNA łańcuch aminokwasów rośnie. Łańcuch ten skręca się i składa w unikalny kształt, tworząc jeden rodzaj białka. Nawet proces zwijania białek jest niezwykły: do obliczenia wszystkiego potrzebny jest komputer opcje złożenie białka średniej wielkości składającego się ze 100 aminokwasów zajęłoby 1027 (!) lat. Utworzenie w organizmie łańcucha 20 aminokwasów zajmuje nie więcej niż jedną sekundę, a proces ten zachodzi w sposób ciągły we wszystkich komórkach organizmu.

Geny, kod genetyczny i jego właściwości.

Na Ziemi żyje około 7 miliardów ludzi. Oprócz 25-30 milionów par identycznych bliźniaków, genetycznie wszyscy ludzie są inni : każdy jest wyjątkowy, ma unikalne cechy dziedziczne, cechy charakteru, zdolności i temperament.

Różnice te zostały wyjaśnione różnice w genotypach- zestawy genów organizmu; Każdy jest wyjątkowy. Ucieleśnione są cechy genetyczne konkretnego organizmu w białkach - dlatego struktura białka jednej osoby różni się, choć bardzo nieznacznie, od białka innej osoby.

To nie znaczyże nie ma dwóch osób o dokładnie takich samych białkach. Białka spełniające te same funkcje mogą być takie same lub różnić się od siebie tylko nieznacznie jednym lub dwoma aminokwasami. Ale nie istnieje na Ziemi ludzi (z wyjątkiem bliźniaków jednojajowych), którzy mieliby wszystkie swoje białka są takie same .

Informacje o strukturze pierwotnej białka kodowany jako sekwencja nukleotydów w odcinku cząsteczki DNA, gen – jednostka dziedzicznej informacji organizmu. Każda cząsteczka DNA zawiera wiele genów. Stanowi ją ogół wszystkich genów organizmu genotyp . Zatem,

Gen to jednostka dziedzicznej informacji organizmu, która odpowiada oddzielnej części DNA

Kodowanie informacji dziedzicznych odbywa się za pomocą kod genetyczny , który jest uniwersalny dla wszystkich organizmów i różni się jedynie naprzemiennością nukleotydów tworzących geny i kodujących białka określonych organizmów.

Kod genetyczny składa się z tripletów (tripletów) nukleotydów DNA, połączonych w różne sekwencje (AAT, HCA, ACG, THC itp.), z których każda koduje konkretny aminokwas (który zostanie wbudowany w łańcuch polipeptydowy).

Faktycznie kod liczy sekwencja nukleotydów w cząsteczce mRNA , ponieważ usuwa informację z DNA (proces transkrypcje ) i przekłada go na sekwencję aminokwasów w cząsteczkach syntetyzowanych białek (proces transmisje ).
Skład mRNA obejmuje nukleotydy A-C-G-U, których trójki nazywane są kodony : triplet na DNA CGT na i-RNA stanie się tripletem GCA, a triplet DNA AAG stanie się tripletem UUC. Dokładnie kodony mRNA kod genetyczny znajduje odzwierciedlenie w zapisie.

Zatem, kod genetyczny - ujednolicony system zapisu informacji dziedzicznej w cząsteczkach kwasu nukleinowego w postaci sekwencji nukleotydów . Kod genetyczny opiera się na zastosowaniu alfabetu składającego się jedynie z czterech liter-nukleotydów, wyróżnionych zasadami azotowymi: A, T, G, C.

Podstawowe właściwości kodu genetycznego:

1. Kod genetyczny tryplet. Triplet (kodon) to sekwencja trzech nukleotydów kodujących jeden aminokwas. Ponieważ białka zawierają 20 aminokwasów, oczywiste jest, że każdy z nich nie może być kodowany przez jeden nukleotyd ( Ponieważ w DNA są tylko cztery rodzaje nukleotydów, w tym przypadku 16 aminokwasów pozostaje niekodowanych). Dwa nukleotydy również nie wystarczą do kodowania aminokwasów, ponieważ w tym przypadku można zakodować tylko 16 aminokwasów. Oznacza to, że najmniejsza liczba nukleotydów kodujących jeden aminokwas musi wynosić co najmniej trzy. W tym przypadku liczba możliwych trójek nukleotydów wynosi 43 = 64.

2. Redundancja (degeneracja) Kod jest konsekwencją jego trypletowego charakteru i oznacza, że ​​jeden aminokwas może być kodowany przez kilka trójek (ponieważ jest 20 aminokwasów i 64 trójki), z wyjątkiem metioniny i tryptofanu, które są kodowane tylko przez jedną trójkę. Ponadto niektóre triplety pełnią określone funkcje: w cząsteczce mRNA triplety UAA, UAG, UGA są kodonami stop, tj. zatrzymywać się-sygnały zatrzymujące syntezę łańcucha polipeptydowego. Trójka odpowiadająca metioninie (AUG), znajdująca się na początku łańcucha DNA, nie koduje aminokwasu, lecz pełni funkcję inicjującą (ekscytującą) lekturę.

3. Jednoznaczność kod - jednocześnie z redundancją kod ma właściwość jednoznaczność : tylko każdy kodon pasuje jeden określony aminokwas.

4. Współliniowość kod, tj. sekwencja nukleotydów w genie Dokładnie odpowiada sekwencji aminokwasów w białku.

5. Kod genetyczny niezachodzące na siebie i zwarte , tj. nie zawiera „znaków interpunkcyjnych”. Oznacza to, że proces odczytu nie dopuszcza możliwości nakładania się kolumn (tripletów) i począwszy od określonego kodonu, odczyt przebiega w sposób ciągły, triplet po triplecie, aż do zatrzymywać się-sygnały ( kodony stop).

6. Kod genetyczny uniwersalny , tj. geny jądrowe wszystkich organizmów kodują informację o białkach w ten sam sposób, niezależnie od poziomu organizacji i systematycznej pozycji tych organizmów.

Istnieć tablice kodu genetycznego do odszyfrowania kodony mRNA i budowa łańcuchów cząsteczek białek.

Reakcje syntezy macierzy.

Reakcje nieznane w przyrodzie nieożywionej zachodzą w układach żywych - reakcje syntezy matrycy.

Termin „matryca” w technologii oznaczają formę służącą do odlewania monet, medali i czcionek typograficznych: hartowany metal dokładnie odwzorowuje wszystkie szczegóły formy używanej do odlewania. Synteza macierzy przypomina odlewanie na matrycy: nowe cząsteczki syntetyzowane są dokładnie według planu zapisanego w strukturze istniejących cząsteczek.

Zasada matrycy kłamie u źródła najważniejsze reakcje syntetyczne komórki, takie jak synteza kwasów nukleinowych i białek. Reakcje te zapewniają dokładną, ściśle określoną sekwencję jednostek monomeru w syntetyzowanych polimerach.

Tu mają miejsce działania kierunkowe. ciągnięcie monomerów w określone miejsce komórki - na cząsteczki, które służą jako matryca, w której zachodzi reakcja. Gdyby takie reakcje zachodziły w wyniku przypadkowych zderzeń cząsteczek, przebiegałyby nieskończenie wolno. Synteza złożonych cząsteczek w oparciu o zasadę matrycy odbywa się szybko i dokładnie. Rola matrycy makrocząsteczki kwasów nukleinowych biorą udział w reakcjach matrixu DNA lub RNA .

Cząsteczki monomeryczne z których syntetyzowany jest polimer – nukleotydy lub aminokwasy – zgodnie z zasadą komplementarności, są umiejscowione i utrwalone na matrycy w ściśle określonej, określonej kolejności.

Wtedy to się dzieje „sieciowanie” jednostek monomeru w łańcuch polimeru i gotowy polimer wyładowuje się z matrycy.

Po tym matryca jest gotowa do złożenia nowej cząsteczki polimeru. Jasne jest, że tak jak na daną formę można odlać tylko jedną monetę lub jedną literę, tak na daną cząsteczkę matrycy można „złożyć” tylko jeden polimer.

Typ reakcji matrycy- specyficzna cecha chemii układów żywych. Stanowią podstawę podstawowej właściwości wszystkich żywych istot - ich zdolności do reprodukcji własnego rodzaju.

Reakcje syntezy szablonów

1. replikacja DNA - replikacja (z łac. replikacja - odnowienie) - proces syntezy cząsteczki potomnej kwasu dezoksyrybonukleinowego na matrixie cząsteczki macierzystego DNA. Podczas kolejnego podziału komórki macierzystej każda komórka potomna otrzymuje jedną kopię cząsteczki DNA, która jest identyczna z DNA pierwotnej komórki macierzystej. Proces ten zapewnia dokładne przekazywanie informacji genetycznej z pokolenia na pokolenie. Replikacja DNA odbywa się za pomocą złożonego kompleksu enzymatycznego składającego się z 15-20 różnych białek, tzw miły . Materiałem do syntezy są wolne nukleotydy obecne w cytoplazmie komórek. Biologiczne znaczenie replikacji polega na dokładnym przekazaniu informacji dziedzicznej z cząsteczki macierzystej do cząsteczek potomnych, co zwykle zachodzi podczas podziału komórek somatycznych.

Cząsteczka DNA składa się z dwóch komplementarnych nici. Łańcuchy te są utrzymywane razem przez słabe wiązania wodorowe, które mogą zostać rozerwane przez enzymy. Cząsteczka DNA jest zdolna do samoduplikacji (replikacji), a na każdej starej połowie cząsteczki syntetyzowana jest nowa połowa.
Ponadto cząsteczkę mRNA można zsyntetyzować na cząsteczce DNA, która następnie przekazuje informację otrzymaną z DNA do miejsca syntezy białka.

Przekazywanie informacji i synteza białek przebiegają według zasady matrycy, porównywalnej do pracy prasy drukarskiej w drukarni. Informacje z DNA są kopiowane wielokrotnie. Jeśli podczas kopiowania wystąpią błędy, będą one powtarzane we wszystkich kolejnych kopiach.

To prawda, że ​​​​niektóre błędy podczas kopiowania informacji za pomocą cząsteczki DNA można poprawić - nazywa się to procesem eliminacji błędów naprawa. Pierwszą z reakcji w procesie przekazywania informacji jest replikacja cząsteczki DNA i synteza nowych łańcuchów DNA.

2. Transkrypcja (z łac. transkrypcja – przepisywanie) – proces syntezy RNA z wykorzystaniem DNA jako matrycy, zachodzący we wszystkich żywych komórkach. Inaczej mówiąc, jest to transfer informacji genetycznej z DNA na RNA.

Transkrypcja jest katalizowana przez enzym polimerazę RNA zależną od DNA. Polimeraza RNA porusza się wzdłuż cząsteczki DNA w kierunku 3” → 5”. Transkrypcja składa się z etapów inicjacja, elongacja i terminacja . Jednostką transkrypcji jest operon, fragment cząsteczki DNA składający się z promotor, część transkrybowana i terminator . mRNA składa się z pojedynczego łańcucha i jest syntetyzowany na DNA zgodnie z zasadą komplementarności przy udziale enzymu, który aktywuje początek i koniec syntezy cząsteczki mRNA.

Gotowa cząsteczka mRNA przedostaje się do cytoplazmy na rybosomy, gdzie następuje synteza łańcuchów polipeptydowych.

3. Audycja (z łac. tłumaczenie- transfer, ruch) - proces syntezy białek z aminokwasów na matrycy informacyjnego (posłańca) RNA (mRNA, mRNA), prowadzony przez rybosom. Inaczej mówiąc, jest to proces tłumaczenia informacji zawartej w sekwencji nukleotydów mRNA na sekwencję aminokwasów w polipeptydzie.

4. Transkrypcja odwrotna to proces tworzenia dwuniciowego DNA na podstawie informacji z jednoniciowego RNA. Proces ten nazywa się odwrotną transkrypcją, ponieważ transfer informacji genetycznej zachodzi w kierunku „odwrotnym” w stosunku do transkrypcji. Idea odwrotnej transkrypcji była początkowo bardzo niepopularna, gdyż była sprzeczna z centralnym dogmatem biologii molekularnej, który zakładał, że DNA ulega transkrypcji na RNA, a następnie ulega translacji na białka.

Jednakże w 1970 roku Temin i Baltimore niezależnie odkryli enzym zwany odwrotna transkryptaza (rewertaza) i ostatecznie potwierdzono możliwość odwrotnej transkrypcji. W 1975 Temin i Baltimore otrzymali Nagrodę Nobla w dziedzinie fizjologii lub medycyny. Niektóre wirusy (takie jak ludzki wirus niedoboru odporności wywołujący zakażenie wirusem HIV) mają zdolność transkrypcji RNA na DNA. HIV ma genom RNA zintegrowany z DNA. W rezultacie DNA wirusa można połączyć z genomem komórki gospodarza. Główny enzym odpowiedzialny za syntezę DNA z RNA nazywa się odwrócenie. Jedną z funkcji Reversase jest tworzenie komplementarnego DNA (cDNA) z genomu wirusa. Powiązany enzym rybonukleaza rozszczepia RNA, a odwrotnaza syntetyzuje cDNA z podwójnej helisy DNA. cDNA jest integrowany z genomem komórki gospodarza za pomocą integrazy. Wynik to synteza białek wirusowych przez komórkę gospodarza, które tworzą nowe wirusy. W przypadku wirusa HIV programowana jest także apoptoza (śmierć komórek) limfocytów T. W innych przypadkach komórka może pozostać dystrybutorem wirusów.

Sekwencję reakcji matrycowych podczas biosyntezy białek można przedstawić w formie diagramu.

Zatem, biosynteza białek- jest to jeden z rodzajów wymiany plastycznej, podczas której informacja dziedziczna zakodowana w genach DNA zostaje wdrożona w określoną sekwencję aminokwasów w cząsteczkach białka.

Zasadniczo są to cząsteczki białka łańcuchy polipeptydowe zbudowane z pojedynczych aminokwasów. Ale aminokwasy nie są wystarczająco aktywne, aby łączyć się ze sobą samodzielnie. Dlatego zanim połączą się ze sobą i utworzą cząsteczkę białka, muszą to być aminokwasy Aktywuj . Aktywacja ta następuje pod wpływem specjalnych enzymów.

W wyniku aktywacji aminokwas staje się bardziej labilny i pod działaniem tego samego enzymu wiąże się z t- RNA. Każdy aminokwas odpowiada ściśle określonemu t- RNA, który znajduje „swój” aminokwas i transfery go do rybosomu.

W związku z tym różne aktywowane aminokwasy w połączeniu z własnymi T- RNA. Rybosom jest podobny przenośnik do złożenia łańcucha białkowego z różnych dostarczonych mu aminokwasów.

Jednocześnie z t-RNA, na którym „siedzi” jego własny aminokwas, „ sygnał„z DNA zawartego w jądrze. Zgodnie z tym sygnałem w rybosomie syntetyzowane jest jedno lub drugie białko.

Kierujący wpływ DNA na syntezę białek nie odbywa się bezpośrednio, ale za pomocą specjalnego pośrednika - matryca Lub informacyjny RNA (m-RNA Lub mRNA), Który syntetyzowany w jądrze e pod wpływem DNA, więc jego skład odzwierciedla skład DNA. Cząsteczka RNA jest jak odlew formy DNA. Zsyntetyzowany mRNA wchodzi do rybosomu i niejako przenosi go do tej struktury plan- w jakiej kolejności należy połączyć ze sobą aktywowane aminokwasy wchodzące do rybosomu, aby doszło do syntezy konkretnego białka? W przeciwnym razie, informacja genetyczna zakodowana w DNA jest przenoszona na mRNA, a następnie na białko.

Cząsteczka mRNA wchodzi do rybosomu i szwy jej. Określany jest ten jego segment, który aktualnie znajduje się w rybosomie kodon (triplet), oddziałuje w zupełnie specyficzny sposób z tymi, które są do niego strukturalnie podobne triplet (antykodon) w transferowym RNA, który wprowadził aminokwas do rybosomu.

Transferowy RNA wraz z aminokwasem pasuje do określonego kodonu mRNA i łączy z nim; do następnej, sąsiedniej sekcji mRNA dodaje się kolejny tRNA z innym aminokwasem i tak dalej, aż zostanie odczytany cały łańcuch i-RNA, aż wszystkie aminokwasy zostaną zredukowane w odpowiedniej kolejności, tworząc cząsteczkę białka. Oraz tRNA, które dostarczyło aminokwas do określonej części łańcucha polipeptydowego, uwolniony od swojego aminokwasu i opuszcza rybosom.

Następnie ponownie w cytoplazmie pożądany aminokwas może się z nią połączyć i ponownie przenieść go do rybosomu. W procesie syntezy białek zaangażowanych jest jednocześnie nie jeden, ale kilka rybosomów – polirybosomów.

Główne etapy przekazywania informacji genetycznej:

1. Synteza DNA jako matrycy dla mRNA (transkrypcja)
2. Synteza łańcucha polipeptydowego w rybosomach zgodnie z programem zawartym w mRNA (translacja) .

Etapy są uniwersalne dla wszystkich żywych istot, ale czasowe i przestrzenne relacje tych procesów różnią się u pro- i eukariontów.

U prokariota transkrypcja i translacja mogą zachodzić jednocześnie, ponieważ DNA znajduje się w cytoplazmie. U eukarionty transkrypcja i translacja są ściśle oddzielone w przestrzeni i czasie: w jądrze zachodzi synteza różnych RNA, po czym cząsteczki RNA muszą opuścić jądro, przechodząc przez błonę jądrową. Następnie RNA są transportowane w cytoplazmie do miejsca syntezy białek.

Kod genetyczny różnych organizmów ma pewne wspólne właściwości:
1) Potrójny. Aby zapisać jakąkolwiek informację, w tym informację dziedziczną, stosuje się pewien szyfr, którego elementem jest litera lub symbol. Zbiór takich symboli składa się na alfabet. Poszczególne wiadomości są zapisywane przy użyciu kombinacji znaków zwanych grupami kodowymi lub kodonami. Dobrze znanym alfabetem składającym się tylko z dwóch znaków jest alfabet Morse'a. W DNA są 4 litery - pierwsze litery nazw zasad azotowych (A, G, T, C), co oznacza, że ​​alfabet genetyczny składa się tylko z 4 znaków. Co to jest grupa kodowa lub słowo kodu genetycznego? Znanych jest 20 aminokwasów zasadowych, których zawartość musi być zapisana w kodzie genetycznym, czyli 4 litery muszą dać 20 słów kodowych. Załóżmy, że słowo składa się z jednego znaku, wówczas otrzymamy tylko 4 grupy kodów. Jeśli słowo składa się z dwóch znaków, wówczas takich grup będzie tylko 16, a to wyraźnie nie wystarczy do zakodowania 20 aminokwasów. Dlatego słowo kodowe musi zawierać co najmniej 3 nukleotydy, co da 64 (43) kombinacje. Ta liczba kombinacji tripletów jest wystarczająca do zakodowania wszystkich aminokwasów. Zatem kodon kodu genetycznego jest trójką nukleotydów.
2) Degeneracja (redundancja) to właściwość kodu genetycznego polegająca z jednej strony na tym, że zawiera on tryplety zbędne, czyli synonimy, a z drugiej strony trojaczki „bezsensowne”. Ponieważ kod zawiera 64 kombinacje, a zakodowanych jest tylko 20 aminokwasów, niektóre aminokwasy są kodowane przez kilka trójek (arginina, seryna, leucyna – sześć; walina, prolina, alanina, glicyna, treonina – cztery; izoleucyna – trzy; fenyloalanina, tyrozyna, histydyna, lizyna, asparagina, glutamina, cysteina, kwas asparaginowy i glutaminowy – dwa; metionina i tryptofan – jedna trójka). Niektóre grupy kodów (UAA, UAG, UGA) w ogóle nie niosą żadnego ładunku semantycznego, to znaczy są trójkami „bez znaczenia”. „Bezsensowne” lub nonsensowne kodony pełnią funkcję terminatorów łańcucha – znaków interpunkcyjnych w tekście genetycznym – służących jako sygnał zakończenia syntezy łańcucha białkowego. Ta redundancja kodu ma ogromne znaczenie dla zwiększenia niezawodności transmisji informacji genetycznej.
3) Nie nakładające się. Trójki kodów nigdy się nie nakładają, tzn. zawsze są nadawane razem. Podczas odczytywania informacji z cząsteczki DNA nie jest możliwe użycie zasady azotowej jednej trójki w połączeniu z zasadami innej trójki.
4) Jednoznaczność. Nie ma przypadków, w których ten sam triplet odpowiada więcej niż jednemu kwasowi.
5) Brak znaków oddzielających w obrębie genu. Kod genetyczny odczytywany jest z określonego miejsca, bez przecinków.
6) Wszechstronność. W różnych typach organizmów żywych (wirusach, bakteriach, roślinach, grzybach i zwierzętach) te same trojaczki kodują te same aminokwasy.
7) Specyfika gatunkowa. Liczba i kolejność zasad azotowych w łańcuchu DNA różni się w zależności od organizmu.

Dziś dla nikogo nie jest tajemnicą, że program życiowy wszystkich żywych organizmów jest zapisany w cząsteczce DNA. Najłatwiej wyobrazić sobie cząsteczkę DNA jako długą drabinę. Pionowe słupki tych schodów składają się z cząsteczek cukru, tlenu i fosforu. Wszystkie ważne informacje operacyjne w cząsteczce są zapisane na szczeblach drabiny - składają się one z dwóch cząsteczek, z których każda jest przymocowana do jednego z pionowych słupków. Cząsteczki te – zasady azotowe – nazywane są adeniną, guaniną, tyminą i cytozyną, ale zwykle są po prostu oznaczone literami A, G, T i C. Kształt tych cząsteczek pozwala im tworzyć wiązania – kompletne drabiny – tylko określonego typu. Są to połączenia pomiędzy zasadami A i T oraz pomiędzy zasadami G i C (tak utworzona para nazywa się „para podstawowa”). W cząsteczce DNA nie może być żadnego innego rodzaju połączeń.

Schodząc po schodach wzdłuż jednej nici cząsteczki DNA, otrzymujesz sekwencję zasad. To właśnie ten przekaz w postaci ciągu zasad determinuje przebieg reakcji chemicznych w komórce, a co za tym idzie, charakterystykę organizmu posiadającego to DNA. Zgodnie z centralnym dogmatem biologii molekularnej cząsteczka DNA koduje informację o białkach, które z kolei pełnią funkcję enzymów ( cm. Katalizatory i enzymy) regulują wszystkie reakcje chemiczne w organizmach żywych.

Ścisła zgodność między sekwencją par zasad w cząsteczce DNA a sekwencją aminokwasów tworzących enzymy białkowe nazywa się kodem genetycznym. Kod genetyczny został rozszyfrowany wkrótce po odkryciu dwuniciowej struktury DNA. Wiadomo było, że nowo odkryta cząsteczka informacyjny, Lub matryca RNA (mRNA lub mRNA) przenosi informację zapisaną na DNA. Biochemicy Marshall W. Nirenberg i J. Heinrich Matthaei z Narodowych Instytutów Zdrowia w Bethesda pod Waszyngtonem przeprowadzili pierwsze eksperymenty, które doprowadziły do ​​znalezienia wskazówek dotyczących kodu genetycznego.

Zaczęli od syntezy sztucznych cząsteczek mRNA składających się wyłącznie z powtarzającej się zasady azotowej uracylu (który jest analogiem tyminy „T” i tworzy wiązania tylko z adeniną „A” z cząsteczki DNA). Dodali te mRNA do probówek z mieszaniną aminokwasów i w każdej probówce tylko jeden z aminokwasów był oznaczony radioaktywnym znacznikiem. Naukowcy odkryli, że sztucznie zsyntetyzowany przez nich mRNA zapoczątkował tworzenie się białka tylko w jednej probówce, która zawierała znakowany aminokwas fenyloalaninę. Ustalili więc, że sekwencja „—U—U—U—” na cząsteczce mRNA (a zatem równoważna sekwencja „—A-A-A—” na cząsteczce DNA) koduje białko składające się wyłącznie z aminokwasu fenyloalanina. Był to pierwszy krok w stronę rozszyfrowania kodu genetycznego.

Dziś wiadomo, że trzy pary zasad cząsteczki DNA (trójka to tzw kodon) kodują jeden aminokwas w białku. Przeprowadzając eksperymenty podobne do opisanych powyżej, genetycy ostatecznie rozszyfrowali cały kod genetyczny, w którym każdy z 64 możliwych kodonów odpowiada konkretnemu aminokwasowi.

Wcześniej podkreślaliśmy, że nukleotydy mają ważną cechę dla powstawania życia na Ziemi - w obecności jednego łańcucha polinukleotydowego w roztworze proces tworzenia drugiego (równoległego) łańcucha następuje samoistnie w oparciu o komplementarne połączenie powiązanych nukleotydów . Niezbędnym warunkiem realizacji tego typu reakcji jest jednakowa liczba nukleotydów w obu łańcuchach oraz ich powinowactwo chemiczne. Jednak podczas syntezy białek, kiedy do struktury białka wprowadzana jest informacja z mRNA, nie można mówić o przestrzeganiu zasady komplementarności. Wynika to z faktu, że w mRNA i w syntetyzowanym białku różni się nie tylko liczba monomerów, ale także, co szczególnie ważne, nie ma między nimi podobieństwa strukturalnego (nukleotydy z jednej strony, aminokwasy z drugiej ). Oczywiste jest, że w tym przypadku istnieje potrzeba stworzenia nowej zasady dokładnego przekładania informacji z polinukleotydu na strukturę polipeptydu. W ewolucji powstała taka zasada, a jej podstawą był kod genetyczny.

Kod genetyczny to system zapisu informacji dziedzicznej w cząsteczkach kwasu nukleinowego, oparty na pewnej przemianie sekwencji nukleotydów w DNA lub RNA, tworząc kodony odpowiadające aminokwasom w białku.

Kod genetyczny ma kilka właściwości.

    Potrójność.

    Degeneracja lub redundancja.

    Jednoznaczność.

    Biegunowość.

    Nie nakładające się.

    Ścisłość.

    Wszechstronność.

Należy zaznaczyć, że niektórzy autorzy proponują także inne właściwości kodu związane z charakterystyką chemiczną nukleotydów zawartych w kodzie czy częstotliwością występowania poszczególnych aminokwasów w białkach organizmu itp. Właściwości te wynikają jednak z właściwości wymienionych powyżej, dlatego rozważymy je tam.

A. Potrójność. Kod genetyczny, podobnie jak wiele skomplikowanych systemów, ma najmniejszą jednostkę strukturalną i najmniejszą funkcjonalną. Trójka jest najmniejszą jednostką strukturalną kodu genetycznego. Składa się z trzech nukleotydów. Kodon jest najmniejszą jednostką funkcjonalną kodu genetycznego. Zwykle trójki mRNA nazywane są kodonami. W kodzie genetycznym kodon pełni kilka funkcji. Po pierwsze, jego główną funkcją jest kodowanie pojedynczego aminokwasu. Po drugie, kodon może nie kodować aminokwasu, ale w tym przypadku pełni inną funkcję (patrz poniżej). Jak widać z definicji, trójka jest pojęciem charakteryzującym podstawowy jednostka strukturalna kod genetyczny (trzy nukleotydy). Kodon – charakteryzuje elementarna jednostka semantyczna genom - trzy nukleotydy decydują o przyłączeniu jednego aminokwasu do łańcucha polipeptydowego.

Elementarną jednostkę strukturalną najpierw rozszyfrowano teoretycznie, a następnie jej istnienie potwierdzono doświadczalnie. Rzeczywiście, 20 aminokwasów nie może być kodowanych za pomocą jednego lub dwóch nukleotydów, ponieważ tych ostatnich jest tylko 4. Trzy z czterech nukleotydów dają 4 3 = 64 warianty, co przekracza liczbę aminokwasów dostępnych w organizmach żywych (patrz tabela 1).

Kombinacje 64 nukleotydów przedstawione w tabeli mają dwie cechy. Po pierwsze, z 64 wariantów tripletów tylko 61 to kodony kodujące dowolny aminokwas; nazywane są one kodony zmysłowe. Trzy trójki nie kodują

Tabela 1.

Kodony informacyjnego RNA i odpowiadające im aminokwasy

FUNDACJA KODONOWA

Nonsens

Nonsens

Nonsens

Met

Wał

aminokwasy a są sygnałami stopu wskazującymi koniec translacji. Istnieją trzy takie trojaczki - UAA, UAG, UGA, nazywane są także „bezsensownymi” (kodonami nonsensownymi). W wyniku mutacji, która jest związana z zastąpieniem jednego nukleotydu w triplecie innym, z kodonu sensownego może powstać kodon nonsensowny. Ten typ mutacji nazywa się bezsensowna mutacja. Jeżeli taki sygnał stopu powstanie wewnątrz genu (w jego części informacyjnej), to podczas syntezy białka w tym miejscu proces będzie stale przerywany – syntetyzowana będzie jedynie pierwsza (przed sygnałem stop) część białka. Osoba z tą patologią odczuje brak białka i doświadczy objawów związanych z tym niedoborem. Na przykład tego rodzaju mutację zidentyfikowano w genie kodującym łańcuch beta hemoglobiny. Syntetyzowany jest skrócony, nieaktywny łańcuch hemoglobiny, który szybko ulega zniszczeniu. W rezultacie powstaje cząsteczka hemoglobiny pozbawiona łańcucha beta. Oczywiste jest, że jest mało prawdopodobne, aby taka cząsteczka w pełni spełniła swoje obowiązki. Występuje poważna choroba, która rozwija się jako niedokrwistość hemolityczna (talasemia beta-zero, od greckiego słowa „Thalas” – Morze Śródziemne, gdzie po raz pierwszy odkryto tę chorobę).

Mechanizm działania kodonów stop różni się od mechanizmu działania kodonów sensownych. Wynika to z faktu, że dla wszystkich kodonów kodujących aminokwasy znaleziono odpowiadające im tRNA. Nie znaleziono tRNA dla kodonów nonsensownych. W związku z tym tRNA nie bierze udziału w procesie zatrzymywania syntezy białek.

KodonSIERPIEŃ (czasami GUG u bakterii) nie tylko kodują aminokwasy metioninę i walinę, ale są takżeinicjator transmisji .

B. Degeneracja lub redundancja.

61 z 64 trójek koduje 20 aminokwasów. Ten trzykrotny nadmiar liczby trójek nad liczbą aminokwasów sugeruje, że w przekazywaniu informacji można zastosować dwie opcje kodowania. Po pierwsze, nie wszystkie 64 kodony mogą być zaangażowane w kodowanie 20 aminokwasów, ale tylko 20, a po drugie, aminokwasy mogą być kodowane przez kilka kodonów. Badania wykazały, że natura skorzystała z tej drugiej opcji.

Jego preferencje są oczywiste. Jeżeli z 64 wariantów trójek tylko 20 było zaangażowanych w kodowanie aminokwasów, wówczas 44 trójki (z 64) pozostałyby niekodujące, tj. bezsensowne (bezsensowne kodony). Już wcześniej wskazywaliśmy, jak niebezpieczne dla życia komórki jest przekształcenie w wyniku mutacji tripletu kodującego w kodon nonsensowny – znacząco zakłóca to normalne funkcjonowanie polimerazy RNA, ostatecznie prowadząc do rozwoju chorób. Obecnie trzy kodony w naszym genomie to nonsens, ale teraz wyobraźmy sobie, co by się stało, gdyby liczba kodonów nonsensownych wzrosła około 15 razy. Jest oczywiste, że w takiej sytuacji przejście kodonów normalnych do kodonów nonsensownych będzie nieporównywalnie wyższe.

Kod, w którym jeden aminokwas jest kodowany przez kilka trójek, nazywa się zdegenerowanym lub zbędnym. Prawie każdy aminokwas ma kilka kodonów. Zatem aminokwas leucyna może być kodowany przez sześć trójek - UUA, UUG, TSUU, TsUC, TsUA, TsUG. Walina jest kodowana przez cztery trójki, fenyloalanina przez dwie i tylko tryptofan i metionina kodowane przez jeden kodon. Właściwość związana z zapisywaniem tej samej informacji za pomocą różnych symboli nazywa się degeneracja.

Liczba kodonów przypisanych do jednego aminokwasu dobrze koreluje z częstotliwością występowania tego aminokwasu w białkach.

I najprawdopodobniej nie jest to przypadkowe. Im większa częstotliwość występowania aminokwasu w białku, im częściej kodon tego aminokwasu jest reprezentowany w genomie, tym większe jest prawdopodobieństwo jego uszkodzenia przez czynniki mutagenne. Dlatego jasne jest, że zmutowany kodon ma większą szansę na kodowanie tego samego aminokwasu, jeśli jest wysoce zdegenerowany. Z tej perspektywy degeneracja kodu genetycznego jest mechanizmem chroniącym ludzki genom przed uszkodzeniami.

Należy zauważyć, że termin „degeneracja” jest używany w genetyce molekularnej w innym znaczeniu. Zatem większość informacji w kodonie zawarta jest w pierwszych dwóch nukleotydach; zasada na trzeciej pozycji kodonu okazuje się mało istotna. Zjawisko to nazywa się „degeneracją trzeciej podstawy”. Ta ostatnia cecha minimalizuje wpływ mutacji. Wiadomo na przykład, że główną funkcją czerwonych krwinek jest transport tlenu z płuc do tkanek i dwutlenku węgla z tkanek do płuc. Funkcję tę pełni pigment oddechowy – hemoglobina, która wypełnia całą cytoplazmę erytrocytu. Składa się z części białkowej – globiny, która jest kodowana przez odpowiedni gen. Oprócz białka cząsteczka hemoglobiny zawiera hem, który zawiera żelazo. Mutacje w genach globiny prowadzą do pojawienia się różnych wariantów hemoglobiny. Najczęściej mutacje są związane z zastąpienie jednego nukleotydu innym i pojawienie się nowego kodonu w genie, który może kodować nowy aminokwas w łańcuchu polipeptydowym hemoglobiny. W triplecie w wyniku mutacji można zastąpić dowolny nukleotyd - pierwszy, drugi lub trzeci. Znanych jest kilkaset mutacji wpływających na integralność genów globiny. W pobliżu 400 z których są związane z zastąpieniem pojedynczych nukleotydów w genie i odpowiadającym zastąpieniem aminokwasów w polipeptydzie. Tylko z tych 100 zamienniki prowadzą do niestabilności hemoglobiny i różnego rodzaju chorób od łagodnych do bardzo ciężkich. 300 (około 64%) mutacji substytucyjnych nie wpływa na funkcję hemoglobiny i nie prowadzi do patologii. Jedną z przyczyn tego jest wspomniana powyżej „degeneracja trzeciej zasady”, gdy zastąpienie trzeciego nukleotydu w triplecie kodującym serynę, leucynę, prolinę, argininę i niektóre inne aminokwasy prowadzi do pojawienia się kodonu synonimicznego kodujące ten sam aminokwas. Taka mutacja nie będzie objawiać się fenotypowo. Natomiast jakakolwiek wymiana pierwszego lub drugiego nukleotydu w trójce w 100% przypadków prowadzi do pojawienia się nowego wariantu hemoglobiny. Ale nawet w tym przypadku mogą nie wystąpić poważne zaburzenia fenotypowe. Powodem tego jest zastąpienie aminokwasu w hemoglobinie innym, podobnym do pierwszego pod względem właściwości fizykochemicznych. Na przykład, jeśli aminokwas o właściwościach hydrofilowych zostanie zastąpiony innym aminokwasem, ale o tych samych właściwościach.

Hemoglobina składa się z grupy żelaza porfirynowego hemu (do którego przyłączone są cząsteczki tlenu i dwutlenku węgla) oraz białka - globiny. Hemoglobina u dorosłych (HbA) zawiera dwa identyczne-łańcuchy i dwa-więzy. Cząsteczka-łańcuch zawiera 141 reszt aminokwasowych,-łańcuch - 146,- I-łańcuchy różnią się wieloma resztami aminokwasowymi. Sekwencja aminokwasowa każdego łańcucha globiny jest kodowana przez jego własny gen. Kodowanie genów-łańcuch znajduje się na krótkim ramieniu chromosomu 16,-gen - w krótkim ramieniu chromosomu 11. Substytucja w kodzie genu-łańcuch hemoglobiny pierwszego lub drugiego nukleotydu prawie zawsze prowadzi do pojawienia się nowych aminokwasów w białku, zakłócenia funkcji hemoglobiny i poważnych konsekwencji dla pacjenta. Przykładowo zastąpienie „C” w jednej z trójek CAU (histydyna) przez „Y” doprowadzi do pojawienia się nowej trójki UAU, kodującej inny aminokwas – tyrozynę. Fenotypowo przejawi się to ciężką chorobą. podobna zamiana w pozycji 63-łańcuch polipeptydu histydynowego do tyrozyny doprowadzi do destabilizacji hemoglobiny. Rozwija się choroba methemoglobinemia. Zastąpienie w wyniku mutacji kwasu glutaminowego waliną na 6 pozycji-łańcuch jest przyczyną najcięższej choroby - anemii sierpowatokrwinkowej. Nie kontynuujmy smutnej listy. Zauważmy tylko, że przy wymianie dwóch pierwszych nukleotydów może pojawić się aminokwas o właściwościach fizykochemicznych podobnych do poprzedniego. Zatem zastąpienie drugiego nukleotydu w jednej z trójek kodujących kwas glutaminowy (GAA) w-łańcuch z „U” prowadzi do pojawienia się nowego tripletu (GUA), kodującego walinę, a zastąpienie pierwszego nukleotydu przez „A” tworzy triplet AAA, kodujący aminokwas lizynę. Kwas glutaminowy i lizyna mają podobne właściwości fizykochemiczne - oba są hydrofilowe. Walina jest aminokwasem hydrofobowym. Dlatego zastąpienie hydrofilowego kwasu glutaminowego hydrofobową waliną znacząco zmienia właściwości hemoglobiny, co ostatecznie prowadzi do rozwoju anemii sierpowatokrwinkowej, natomiast zastąpienie hydrofilowego kwasu glutaminowego hydrofilową lizyną w mniejszym stopniu zmienia funkcję hemoglobiny – u pacjentów rozwija się postać łagodna anemii. W wyniku zamiany trzeciej zasady, nowa trójka może kodować te same aminokwasy, co poprzednia. Przykładowo, jeśli w triplecie CAC uracyl został zastąpiony cytozyną i pojawił się triplet CAC, to u człowieka praktycznie nie zostaną wykryte żadne zmiany fenotypowe. Jest to zrozumiałe, ponieważ obie trójki kodują ten sam aminokwas – histydynę.

Podsumowując, należy podkreślić, że degeneracja kodu genetycznego i degeneracja trzeciej zasady z ogólnego biologicznego punktu widzenia to mechanizmy ochronne nieodłącznie związane z ewolucją w unikalnej strukturze DNA i RNA.

V. Jednoznaczność.

Każda trójka (z wyjątkiem nonsensu) koduje tylko jeden aminokwas. Zatem w kierunku kodon - aminokwas kod genetyczny jest jednoznaczny, w kierunku aminokwas - kodon jest niejednoznaczny (zdegenerowany).

Niedwuznaczny

Kodon aminokwasu

Zdegenerowany

I w tym przypadku potrzeba jednoznaczności w kodzie genetycznym jest oczywista. W innej opcji, podczas translacji tego samego kodonu, do łańcucha białkowego zostaną wstawione różne aminokwasy, w wyniku czego powstaną białka o różnych strukturach pierwszorzędowych i różnych funkcjach. Metabolizm komórkowy przestawiłby się na tryb działania „jeden gen – kilka polipeptydów”. Jest oczywiste, że w takiej sytuacji funkcja regulacyjna genów zostałaby całkowicie utracona.

g. Polaryzacja

Odczyt informacji z DNA i mRNA następuje tylko w jednym kierunku. Polaryzacja jest ważna przy definiowaniu struktur wyższego rzędu (wtórnych, trzeciorzędnych itp.). Wcześniej mówiliśmy o tym, jak struktury niższego rzędu determinują struktury wyższego rzędu. Struktura trzeciorzędowa i struktury wyższego rzędu w białkach powstają, gdy tylko zsyntetyzowany łańcuch RNA opuszcza cząsteczkę DNA lub łańcuch polipeptydowy opuszcza rybosom. Podczas gdy wolny koniec RNA lub polipeptydu uzyskuje strukturę trzeciorzędową, drugi koniec łańcucha jest w dalszym ciągu syntetyzowany na DNA (w przypadku transkrypcji RNA) lub rybosomie (w przypadku transkrypcji polipeptydu).

Dlatego jednokierunkowy proces odczytywania informacji (podczas syntezy RNA i białka) jest niezbędny nie tylko do ustalenia sekwencji nukleotydów czy aminokwasów w syntetyzowanej substancji, ale także do ścisłego określenia drugorzędowej, trzeciorzędowej itp. Struktury.

d. Brak nakładania się.

Kod może się nakładać lub nie. Większość organizmów ma nienakładający się kod. W niektórych fagach można znaleźć nakładający się kod.

Istotą kodu niezachodzącego na siebie jest to, że nukleotyd jednego kodonu nie może być jednocześnie nukleotydem innego kodonu. Gdyby kody nakładały się, wówczas sekwencja siedmiu nukleotydów (GCUGCUG) mogłaby kodować nie dwa aminokwasy (alanina-alanina) (ryc. 33, A) jak w przypadku kodu niezachodzącego na siebie, ale trzy (jeśli jest jeden wspólny nukleotyd) (ryc. 33, B) lub pięć (jeśli wspólne są dwa nukleotydy) (patrz ryc. 33, C). W dwóch ostatnich przypadkach mutacja dowolnego nukleotydu doprowadziłaby do naruszenia sekwencji dwóch, trzech itd. aminokwasy.

Ustalono jednak, że mutacja jednego nukleotydu zawsze zakłóca włączenie jednego aminokwasu do polipeptydu. Jest to istotny argument świadczący o tym, że kod się nie nakłada.

Wyjaśnijmy to na rysunku 34. Pogrubione linie pokazują trójki kodujące aminokwasy w przypadku kodu nienakładającego się i nakładającego się. Eksperymenty wyraźnie wykazały, że kod genetyczny nie nakłada się. Nie wchodząc w szczegóły eksperymentu, zauważamy, że jeśli zastąpisz trzeci nukleotyd w sekwencji nukleotydów (patrz ryc. 34)U (oznaczone gwiazdką) na inną rzecz:

1. W przypadku niezachodzącego na siebie kodu białko kontrolowane przez tę sekwencję będzie miało substytucję jednego (pierwszego) aminokwasu (oznaczonego gwiazdkami).

2. W przypadku nakładającego się kodu w opcji A podstawienie nastąpi w dwóch (pierwszym i drugim) aminokwasach (oznaczonych gwiazdkami). W opcji B zastąpienie dotyczyłoby trzech aminokwasów (oznaczonych gwiazdkami).

Jednakże liczne eksperymenty wykazały, że w przypadku przerwania jednego nukleotydu w DNA, zaburzenie w białku zawsze dotyczy tylko jednego aminokwasu, co jest typowe dla kodu niezachodzącego na siebie.

GZUGZUG GZUGZUG GZUGZUG

GCU GCU GCU UGC GCU GCU GCU UGC GCU GCU GCU

*** *** *** *** *** ***

Alanin - Alanin Ala - Cis - Ley Ala - Ley - Ley - Ala - Ley

A B C

Kod nienakładający się Kod nakładający się

Ryż. 34. Schemat wyjaśniający obecność nienakładającego się na siebie kodu w genomie (objaśnienie w tekście).

Nienakładanie się kodu genetycznego wiąże się z jeszcze jedną właściwością – odczytywanie informacji rozpoczyna się od pewnego momentu – sygnału inicjującego. Takim sygnałem inicjacji w mRNA jest kodon kodujący metioninę AUG.

Należy zauważyć, że dana osoba nadal ma niewielką liczbę genów, które odbiegają od ogólnej zasady i nakładają się.

e. Zwartość.

Pomiędzy kodonami nie ma znaków interpunkcyjnych. Inaczej mówiąc, trojaczki nie są od siebie oddzielone np. jednym nic nie znaczącym nukleotydem. Eksperymentalnie udowodniono brak „znaków interpunkcyjnych” w kodzie genetycznym.

I. Wszechstronność.

Kod jest taki sam dla wszystkich organizmów żyjących na Ziemi. Bezpośredni dowód uniwersalności kodu genetycznego uzyskano poprzez porównanie sekwencji DNA z odpowiadającymi im sekwencjami białek. Okazało się, że wszystkie genomy bakteryjne i eukariotyczne korzystają z tych samych zestawów wartości kodowych. Są wyjątki, ale nie jest ich wiele.

Pierwsze wyjątki od uniwersalności kodu genetycznego znaleziono w mitochondriach niektórych gatunków zwierząt. Dotyczyło to kodonu terminatora UGA, który brzmi tak samo jak kodon UGG, kodujący aminokwas tryptofan. Stwierdzono także inne, rzadsze odchylenia od uniwersalności.

MZ. Kod genetyczny to system zapisu informacji dziedzicznej w cząsteczkach kwasu nukleinowego, oparty na pewnej przemianie sekwencji nukleotydowych w DNA lub RNA tworzących kodony,

odpowiadające aminokwasom w białku.Kod genetyczny ma kilka właściwości.