Aké vlastnosti má genetický kód? Biosyntéza bielkovín a nukleových kyselín. Gény, genetický kód

Prednáška 5. Genetický kód

Definícia pojmu

Genetický kód je systém na zaznamenávanie informácií o sekvencii aminokyselín v proteínoch pomocou sekvencie usporiadania nukleotidov v DNA.

Keďže DNA nie je priamo zapojená do syntézy bielkovín, kód je napísaný v jazyku RNA. RNA obsahuje uracil namiesto tymínu.

Vlastnosti genetického kódu

1. Trojčatá

Každá aminokyselina je kódovaná ako sekvencia 3 nukleotidov.

Definícia: triplet alebo kodón - sekvencia troch nukleotidov, ktorá kóduje jednu aminokyselinu.

Kód nemôže byť singletový, pretože 4 (počet rôznych nukleotidov v DNA) je menší ako 20. Kód nemôže byť dubletovaný, pretože 16 (počet kombinácií a permutácií 4 nukleotidov po 2) je menší ako 20. Kód môže byť trojitý, keďže 64 (počet kombinácií a permutácií od 4 do 3) je viac ako 20.

2. Degenerácia.

Všetky aminokyseliny, s výnimkou metionínu a tryptofánu, sú kódované viac ako jedným tripletom:

2 AK 1 triplet = 2.

9 AK 2 triplety = 18.

1 AK 3 triplety = 3.

5 AK 4 trojčatá = 20.

3 AK 6 trojíc = 18.

Celkovo 61 tripletov kóduje 20 aminokyselín.

3. Prítomnosť intergénových interpunkčných znamienok.

Definícia:

Gene je časť DNA, ktorá kóduje jeden polypeptidový reťazec alebo jednu molekulu tPHK, rRNA alebosPHK.

GénytPHK, rPHK, sPHKproteíny nekódujú.

Na konci každého génu kódujúceho polypeptid je aspoň jeden z 3 tripletov kódujúcich stop kodóny RNA alebo stop signály. V mRNA vyzerajú takto: UAA, UAG, UGA ... Ukončia (ukončia) vysielanie.

Obvykle sa kodón vzťahuje aj na interpunkčné znamienka AUG - prvý po vedúcej sekvencii. (Pozri prednášku 8) Funguje ako veľké písmeno. V tejto polohe kóduje formylmetionín (v prokaryotoch).

4. Jednoznačnosť.

Každý triplet kóduje iba jednu aminokyselinu alebo je terminátorom translácie.

Výnimkou je kodón AUG ... U prokaryotov na prvej pozícii (veľké písmeno) kóduje formylmetionín a na akejkoľvek inej pozícii pre metionín.

5. Kompaktnosť alebo absencia intragénnych interpunkčných znamienok.
V géne je každý nukleotid súčasťou významného kodónu.

V roku 1961 Seymour Benzer a Francis Crick experimentálne dokázali, že kód je trojitý a kompaktný.

Podstata experimentu: „+“ mutácia – vloženie jedného nukleotidu. "-" mutácia je strata jedného nukleotidu. Jediná "+" alebo "-" mutácia na začiatku génu pokazí celý gén. Dvojitá mutácia „+“ alebo „-“ tiež kazí celý gén.

Trojitá „+“ alebo „-“ mutácia na začiatku génu pokazí len jeho časť. Štvornásobná + alebo - mutácia opäť pokazí celý gén.

Experiment to dokazuje kód je zložitý a v géne nie sú žiadne interpunkčné znamienka. Experiment sa uskutočnil na dvoch susedných fágových génoch a okrem toho ukázal, prítomnosť interpunkčných znamienok medzi génmi.

6. Všestrannosť.

Genetický kód je rovnaký pre všetky tvory žijúce na Zemi.

V roku 1979 otvoril Burrell ideálne kód ľudskej mitochondrie.

Definícia:

„Ideálny“ je genetický kód, v ktorom je splnené pravidlo degenerácie kvázidubletového kódu: Ak sa prvé dva nukleotidy zhodujú v dvoch tripletoch a tretie nukleotidy patria do rovnakej triedy (oba sú puríny alebo obidva sú pyrimidíny) , potom tieto triplety kódujú rovnakú aminokyselinu ...

Vo generickom kóde existujú dve výnimky z tohto pravidla. Obe odchýlky od ideálneho kódu v univerzále sa týkajú základných bodov: začiatku a konca syntézy bielkovín:

Codon

Univerzálny

kód

Mitochondriálne kódy

Stavovce

Bezstavovce

Kvasnice

Rastliny

STOP

STOP

S UA

A G A

STOP

STOP

230 substitúcií nemení triedu kódovanej aminokyseliny. na trhavosť.

V roku 1956 Georgy Gamow navrhol variant prekrývajúceho sa kódu. Podľa Gamowovho kódu je každý nukleotid, počnúc tretím v géne, zahrnutý do 3 kodónov. Pri rozlúštení genetického kódu sa ukázalo, že sa neprekrýva, t.j. každý nukleotid je zahrnutý iba v jednom kodóne.

Výhody prekrývajúceho sa genetického kódu: kompaktnosť, menšia závislosť proteínovej štruktúry na inzercii alebo delécii nukleotidov.

Nevýhoda: vysoká závislosť štruktúry proteínu od substitúcie nukleotidov a obmedzenie na susedov.

V roku 1976 bola sekvenovaná DNA fága φX174. Má jednovláknovú kruhovú DNA s 5375 nukleotidmi. Bolo známe, že fág kóduje 9 proteínov. Pre 6 z nich boli identifikované gény, ktoré sú umiestnené jeden po druhom.

Ukázalo sa, že dochádza k prekrývaniu. Gén E je úplne v géne D ... Jeho iniciačný kodón sa objavuje ako výsledok posunu čítania o jeden nukleotid. Gene J začína tam, kde končí gén D ... Génový iniciačný kodón J sa prekrýva s terminačným kodónom génu D v dôsledku posunu dvoch nukleotidov. Konštrukt sa nazýva "posun čítacieho rámca" počtom nukleotidov, ktorý nie je násobkom troch. K dnešnému dňu sa prekrývanie ukázalo len pre niekoľko fágov.

informačná kapacita DNA

Na Zemi žije 6 miliárd ľudí. Dedičné informácie o nich
obsiahnuté v 6x109 spermiách. Podľa rôznych odhadov má človek od 30 do 50
tisíce génov. Všetci ľudia majú ~ 30x1013 génov alebo 30x1016 párov báz, čo je 1017 kodónov. Priemerná strana knihy obsahuje 25x102 znakov. DNA 6x109 spermií obsahuje informácie o objeme približne rovnaké

4x10 13 strán knihy. Tieto stránky by zaberali objem 6 budov NSU. 6x109 spermií zaberá polovicu náprstka. Ich DNA zaberá menej ako štvrtinu náprstku.

DNA a RNA nukleotidov
  1. Purín: adenín, guanín
  2. Pyrimidín: cytozín, tymín (uracil)

Codon- triplet nukleotidov kódujúcich špecifickú aminokyselinu.

tab. 1. Aminokyseliny bežne sa vyskytujúce v bielkovinách
názov Skrátené označenie
1. AlanínAla
2. ArginínArg
3. AsparagínAsn
4. Kyselina asparágováAsp
5. CysteínCys
6. Kyselina glutámováGlu
7. GlutamínGln
8. GlycínGly
9. HistidínJeho
10. IzoleucínIle
11. LeucínLeu
12. LyzínLys
13. MetionínMet
14. FenylalanínPhe
15. ProlínPro
16. SériaSer
17. TreonínThr
18. TryptofánTrp
19. TyrozínTyr
20. ValínVal

Genetický kód, ktorý sa tiež nazýva aminokyselinový kód, je systém na zaznamenávanie informácií o sekvencii umiestnenia aminokyselín v proteíne pomocou sekvencie umiestnenia nukleotidových zvyškov v DNA, ktoré obsahujú jednu zo 4 dusíkatých báz: adenín (A), guanín (G), cytozín (C) a tymín (T). Keďže však dvojvláknová špirála DNA nie je priamo zapojená do syntézy proteínu kódovaného jedným z týchto vlákien (tj RNA), kód je napísaný v jazyku RNA, v ktorom je zahrnutý uracil (U). namiesto tymínu. Z rovnakého dôvodu je zvykom hovoriť, že kód je sekvencia nukleotidov, nie pár nukleotidov.

Genetický kód predstavujú určité kódové slová – kodóny.

Prvé kódové slovo rozlúštili Nirenberg a Mattei v roku 1961. Získali extrakt z E. coli obsahujúci ribozómy a ďalšie faktory potrebné na syntézu bielkovín. Výsledkom je bezbunkový systém na syntézu proteínov, ktorý by mohol zostaviť proteín z aminokyselín, ak by sa do média pridala potrebná mRNA. Pridaním syntetickej RNA zloženej len z uracilov do média zistili, že vznikol proteín tvorený len fenylalanínom (polyfenylalanínom). Tak sa zistilo, že triplet UUU nukleotidov (kodón) zodpovedá fenylalanínu. Počas nasledujúcich 5-6 rokov boli určené všetky kodóny genetického kódu.

Genetický kód je druh slovníka, ktorý prekladá text napísaný v štyroch nukleotidoch na proteínový text napísaný v 20 aminokyselinách. Zvyšok aminokyselín nachádzajúcich sa v proteíne sú modifikácie jednej z 20 aminokyselín.

Vlastnosti genetického kódu

Genetický kód má nasledujúce vlastnosti.

  1. Trojitosť- každá aminokyselina zodpovedá trojici nukleotidov. Je ľahké vypočítať, že existuje 4 3 = 64 kodónov. Z toho je 61 sémantických a 3 bezvýznamové (ukončenie, stop kodóny).
  2. Kontinuita(žiadne deliace znaky medzi nukleotidmi) - žiadne intragénne interpunkčné znamienka;

    V géne je každý nukleotid súčasťou významného kodónu. V roku 1961. Seymour Benzer a Francis Crick experimentálne dokázali trojitosť kódu a jeho kontinuitu (kompaktnosť) [šou]

    Podstata experimentu: „+“ mutácia – vloženie jedného nukleotidu. "-" mutácia je strata jedného nukleotidu.

    Jednoduchá mutácia ("+" alebo "-") na začiatku génu alebo dvojitá mutácia ("+" alebo "-") - pokazí celý gén.

    Trojitá mutácia ("+" alebo "-") na začiatku génu poškodí iba časť génu.

    Štvornásobná + alebo - mutácia opäť pokazí celý gén.

    Experiment sa uskutočnil na dvoch susedných fágových génoch a ukázal to

    1. kód je triplet a vnútri génu nie sú žiadne interpunkčné znamienka
    2. medzi génmi sú interpunkčné znamienka
  3. Prítomnosť intergénových interpunkčných znamienok- prítomnosť iniciačných kodónov medzi tripletmi (s ktorými začína biosyntéza bielkovín), kodóny - terminátory (označujú koniec biosyntézy bielkovín);

    K interpunkčným znamienkam zvyčajne patrí aj kodón AUG, prvý po vedúcej sekvencii. Funguje ako veľké písmeno. V tejto polohe kóduje formylmetionín (v prokaryotoch).

    Na konci každého génu kódujúceho polypeptid je aspoň jeden z 3 stop kodónov alebo stop signálov: UAA, UAG, UGA. Ukončia vysielanie.

  4. Kolinearita- zhoda lineárnej sekvencie kodónov mRNA a aminokyselín v proteíne.
  5. Špecifickosť- každá aminokyselina zodpovedá len určitým kodónom, ktoré nemožno použiť pre inú aminokyselinu.
  6. Jednosmernosť- kodóny sa čítajú v jednom smere - od prvého nukleotidu k ďalšiemu
  7. Degenerácia alebo nadbytočnosť, - jedna aminokyselina môže byť kódovaná niekoľkými tripletmi (aminokyseliny - 20, možných tripletov - 64, 61 z nich je sémantických, to znamená, že v priemere každá aminokyselina zodpovedá asi 3 kodónom); výnimkou je metionín (Met) a tryptofán (Trp).

    Dôvodom degenerácie kódu je, že hlavnú sémantickú záťaž nesú prvé dva nukleotidy v triplete a tretí nie je taký dôležitý. Odtiaľ pravidlo degenerácie kódu : ak dva kodóny majú dva identické prvé nukleotidy a ich tretie nukleotidy patria do rovnakej triedy (purín alebo pyrimidín), potom kódujú rovnakú aminokyselinu.

    Z tohto ideálneho pravidla však existujú dve výnimky. Ide o kodón AUA, ktorý by nemal zodpovedať izoleucínu, ale metionínu, a kodón UGA, ktorý je terminátorom, pričom by mal zodpovedať tryptofánu. Degenerácia kódu má samozrejme adaptívny význam.

  8. Všestrannosť- všetky vyššie uvedené vlastnosti genetického kódu sú charakteristické pre všetky živé organizmy.
    Codon Všeobecný kód Mitochondriálne kódy
    Stavovce Bezstavovce Kvasnice Rastliny
    UGASTOPTrpTrpTrpSTOP
    AUAIleMetMetMetIle
    CUALeuLeuLeuThrLeu
    AGAArgSTOPSerArgArg
    AGGArgSTOPSerArgArg

    Nedávno sa princíp univerzálnosti kódu otriasol v súvislosti s objavom ideálneho kódu pre ľudské mitochondrie, v ktorom sa napĺňa pravidlo degenerácie kódu, Berell v roku 1979. V mitochondriálnom kóde kodón UGA zodpovedá tryptofánu a AUA zodpovedá metionínu, ako to vyžaduje pravidlo degenerácie kódu.

    Možno na začiatku evolúcie mali všetky najjednoduchšie organizmy rovnaký kód ako mitochondrie a potom prešiel menšími odchýlkami.

  9. Neprekrývanie- každý z tripletov genetického textu je na sebe nezávislý, jeden nukleotid je zahrnutý len v jednom triplete; Na obr. ukazuje rozdiel medzi prekrývajúcim sa a neprekrývajúcim sa kódom.

    V roku 1976. DNA fága φX174 bola sekvenovaná. Má jednovláknovú kruhovú DNA s 5375 nukleotidmi. Bolo známe, že fág kóduje 9 proteínov. Pre 6 z nich boli identifikované gény, ktoré sú umiestnené jeden po druhom.

    Ukázalo sa, že dochádza k prekrývaniu. Gén E je celý v géne D. Jeho iniciačný kodón sa objavuje ako výsledok posunu čítania o jeden nukleotid. Gén J začína tam, kde končí gén D. Štartovací kodón J sa prekrýva s koncovým kodónom D o dva nukleotidové posuny. Konštrukt sa nazýva "posun čítacieho rámca" počtom nukleotidov, ktorý nie je násobkom troch. K dnešnému dňu sa prekrývanie ukázalo len pre niekoľko fágov.

  10. Imunita- pomer počtu konzervatívnych substitúcií k počtu radikálových substitúcií.

    Mutácie nukleotidových substitúcií, ktoré nevedú k zmene triedy kódovanej aminokyseliny, sa nazývajú konzervatívne. Mutácie nukleotidových substitúcií vedúce k zmene triedy kódovanej aminokyseliny sa nazývajú radikál.

    Keďže tá istá aminokyselina môže byť kódovaná rôznymi tripletmi, niektoré substitúcie v tripletoch nevedú k substitúcii kódovanej aminokyseliny (napríklad UUU -> UUC zanecháva fenylalanín). Niektoré substitúcie menia aminokyselinu na inú z rovnakej triedy (nepolárne, polárne, zásadité, kyslé), iné substitúcie menia triedu aminokyseliny.

    V každom triplete sa môže uskutočniť 9 jednotlivých substitúcií, t.j. môžeme si vybrať, ktorú z pozícií zmeníme - sú tri spôsoby (1. alebo 2. alebo 3.), pričom zvolené písmeno (nukleotid) je možné zmeniť na 4-1 = 3 ďalšie písmená (nukleotidy). Celkový počet možných substitúcií nukleotidov je 61 x 9 = 549.

    Pri priamom počítaní podľa tabuľky genetického kódu si môžeme byť istí, že z nich: 23 nukleotidových substitúcií vedie k objaveniu sa kodónov - terminátorov translácie. 134 substitúcií nemení kódovanú aminokyselinu. 230 substitúcií nemení triedu kódovanej aminokyseliny. 162 substitúcií vedie k zmene v triede aminokyselín, t.j. sú radikálne. Zo 183 substitúcií 3. nukleotidu vedie 7 k objaveniu sa terminátorov translácie a 176 je konzervatívnych. Zo 183 substitúcií 1. nukleotidu vedie 9 k objaveniu sa terminátorov, 114 je konzervatívnych a 60 je radikálnych. Zo 183 substitúcií 2. nukleotidu vedie 7 k výskytu terminátorov, 74 je konzervatívnych, 102 je radikálnych.


Sériu článkov popisujúcich vznik GC možno považovať za skúmanie udalostí, o ktorých máme množstvo stôp. Na pochopenie týchto článkov je však potrebné malé úsilie na pochopenie molekulárnych mechanizmov syntézy bielkovín. Tento článok je úvodom do série autopublikácií venovaných pôvodu genetického kódu a je tým najlepším miestom, kde sa môžete s touto témou začať zoznamovať.
Zvyčajne genetický kód(HA) je definovaná ako metóda (pravidlo) kódovania proteínu na primárna štruktúra DNA alebo RNA. V literatúre sa najčastejšie píše, že ide o korešpondenciu jedna ku jednej sekvencii troch nukleotidov v géne s jednou aminokyselinou v syntetizovanom proteíne alebo s miestom, kde sa syntéza proteínov končí. V tejto definícii sú však dve chyby. To znamená 20, takzvaných kanonických aminokyselín, ktoré sú súčasťou bielkovín všetkých živých organizmov bez výnimky. Tieto aminokyseliny sú proteínové monoméry. Chyby sú nasledovné:

1) Kanonických aminokyselín nie je 20, ale len 19. Aminokyselinou môžeme nazvať látku, ktorá súčasne obsahuje aminoskupinu -NH 2 a karboxylovú skupinu - COOH. Faktom je, že proteínový monomér, prolín, nie je aminokyselina, pretože obsahuje iminoskupinu namiesto aminoskupiny, takže je správnejšie nazývať prolín iminokyselinou. V budúcnosti však vo všetkých článkoch venovaných HA pre pohodlie napíšem asi 20 aminokyselín, čo naznačuje túto nuanciu. Štruktúry aminokyseliny sú znázornené na obr. 1.

Ryža. 1. Štruktúry kanonických aminokyselín. Aminokyseliny majú konštantné časti, označené na obrázku čiernou farbou, a variabilné (alebo radikály) označené červenou farbou.

2) Zhoda aminokyselín s kodónmi nie je vždy jednoznačná. Porušenie jednoznačných prípadov pozri nižšie.

Vznik HA znamená vznik kódovanej syntézy proteínov. Táto udalosť je jednou z kľúčových udalostí pre evolučné formovanie prvých živých organizmov.

Štruktúra HA je znázornená v kruhovej forme na obr. 2.



Ryža. 2. Genetický kód v kruhovom tvare. Vnútorný kruh je prvé písmeno kodónu, druhé kruh - druhé písmeno kodónu, tretí kruh je tretie písmeno kodónu, štvrtý kruh je označenie aminokyselín v trojpísmenovej skratke; P - polárne aminokyseliny, NP - nepolárne aminokyseliny. Pre prehľadnosť symetrie je dôležité zvolené poradie symbolov. U - C - A - G.

Začnime teda popisovať hlavné vlastnosti HA.

1. Trojitosť. Každá aminokyselina je kódovaná ako sekvencia troch nukleotidov.

2. Prítomnosť intergénových interpunkčných znamienok. Medzigénne interpunkčné znamienka zahŕňajú sekvencie nukleových kyselín, v ktorých translácia začína alebo končí.

Preklad nemôžem začať od akéhokoľvek kodónu, ale iba od presne definovaného - štartovanie... Štartovací kodón obsahuje triplet AUG, od ktorého začína translácia. V tomto prípade tento triplet kóduje buď metionín, alebo inú aminokyselinu - formylmetionín (u prokaryotov), ​​ktorú možno zaradiť len na začiatku syntézy bielkovín. Na konci každého génu kódujúceho polypeptid je aspoň jeden z 3 terminačné kodóny, alebo brzdové svetlá: UAA, UAG, UGA. Ukončujú transláciu (takto sa nazýva syntéza bielkovín na ribozóme).

3. Kompaktnosť alebo nedostatok intragénnych interpunkčných znamienok. V géne je každý nukleotid súčasťou významného kodónu.

4. Neprekrývanie. Kodóny sa navzájom neprekrývajú, každý má svoje usporiadané sady nukleotidov, ktoré sa neprekrývajú s podobnými sadami susedných kodónov.

5. Degenerácia. Reverzné mapovanie v smere aminokyselina-kodón je nejednoznačné. Táto vlastnosť sa nazýva degenerácia. séria je súbor kodónov kódujúcich jednu aminokyselinu, inými slovami, je to skupina ekvivalentné kodóny... Predstavte si kodón ako XYZ. Ak XY definuje „význam“ (tj aminokyselinu), potom sa nazýva kodón silný... Ak je na určenie významu kodónu potrebné určité Z, potom sa takýto kodón nazýva slabý.

Degenerácia kódu úzko súvisí s nejednoznačnosťou párovania kodón-antikodón (antikodón znamená sekvenciu troch nukleotidov na tRNA, ktorá sa môže komplementárne spárovať s kodónom na messengerovej RNA (viac podrobností nájdete v dvoch článkoch: Molekulárne mechanizmy degenerácie kódu a Lagerkvistovo pravidlo. Fyzikálnochemické zdôvodnenie symetrií a Rumerove vzťahy). Jeden antikodón na tRNA dokáže rozpoznať jeden až tri kodóny na mRNA.

6.Jednoznačnosť. Každý triplet kóduje iba jednu aminokyselinu alebo je terminátorom translácie a.

Sú známe tri výnimky.

Najprv. U prokaryotov na prvej pozícii (veľké písmeno) kóduje formylmetionín a na ktoromkoľvek inom - metionín.Na začiatku génu je formylmetionín kódovaný ako obvyklým metionínovým kodónom AUG, tak aj valínovým kodónom GUG alebo leucínom. UUG, ktorý vo vnútri génu kóduje valín a leucín, resp.

V mnohých proteínoch sa formylmetionín odštiepi alebo formylová skupina sa odstráni, v dôsledku čoho sa formylmetionín premení na obyčajný metionín.

Po druhé. V roku 1986 niekoľko výskumných skupín naraz zistilo, že na mRNA môže stop kodón UGA kódovať selenocysteín (pozri obr. 3), za predpokladu, že za ním nasleduje špeciálna nukleotidová sekvencia.

Ryža. 3. Štruktúra 21. aminokyseliny – selenocysteínu.

Mať E. coli(toto je Latinský názov Escherichia coli) selenocysteyl-tRNA počas translácie a rozpoznáva kodón UGA v mRNA, ale len v určitom kontexte, napr.: pre rozpoznanie kodónu UGA ako zmysluplného je dôležitá sekvencia s dĺžkou 45 nukleotidov umiestnená za kodónom UGA.

Uvažovaný príklad ukazuje, že v prípade potreby môže živý organizmus zmeniť význam štandardného genetického kódu. V tomto prípade je genetická informácia obsiahnutá v génoch zakódovaná zložitejším spôsobom. Význam kodónu je definovaný v kontexte e so špecifickou rozšírenou nukleotidovou sekvenciou a za účasti niekoľkých vysoko špecifických proteínových faktorov. Je dôležité, že selenocysteín ​​tRNA bol nájdený u predstaviteľov všetkých troch vetiev života (archaea, eubaktérie a eukaryoty), čo naznačuje starovekosť pôvodu syntézy selenocysteínu a možno aj jeho prítomnosť u posledného univerzálneho spoločného predka. (o čom bude reč v iných článkoch). Selenocysteín sa s najväčšou pravdepodobnosťou nachádza vo všetkých živých organizmoch bez výnimky. Ale v každom jednotlivom organizme sa selenocysteín nenachádza viac ako v páre proteínov. Je súčasťou aktívne centrá enzýmy, v mnohých homológoch, z ktorých obyčajný cysteín môže fungovať v podobnej polohe.

Až donedávna sa predpokladalo, že kodón UGA možno čítať buď ako selenocysteín ​​alebo terminál, ale nedávno sa ukázalo, že u nálevníkov Euplotes kodón UGA kóduje buď cysteín alebo selenocysteín. Cm." Genetický kód umožňuje nezrovnalosti"

Tretia výnimka. V niektorých prokaryotoch (5 druhov archeí a jedna eubaktéria – informácie na Wikipédii sú veľmi zastarané) sa vyskytuje špeciálna kyselina – pyrolyzín (obr. 4). Je kódovaný UAG tripletom, ktorý v kanonickom kóde slúži ako terminátor prekladu a. Predpokladá sa, že v tomto prípade, podobne ako v prípade kódovania selenocysteínu, dochádza k čítaniu UAG ako pyrolyzínového kodónu vďaka špeciálnej štruktúre na mRNA. Pyrrolyzínová tRNA obsahuje antikodón CTA a je aminoacylovaná APCázou triedy 2 genetický kód ").

UAG sa zriedka používa ako stop kodón a ak sa používa, často za ním nasleduje ďalší stop kodón.

Ryža. 4. Štruktúra 22. aminokyseliny pyrolyzínu.

7. Všestrannosť. Po dokončení dekódovania Občianskeho zákonníka v polovici 60. rokov minulého storočia, dlho verilo sa, že kód je rovnaký vo všetkých organizmoch, čo naznačuje jednotu pôvodu všetkého života na Zemi.

Skúsme pochopiť, prečo je HA univerzálna. Faktom je, že ak by sa v tele zmenilo aspoň jedno kódovacie pravidlo, viedlo by to k zmene štruktúry významnej časti bielkovín. Takáto zmena by bola príliš drastická a preto takmer vždy smrteľná, pretože zmena významu iba jedného kodónu môže ovplyvniť v priemere 1/64 všetkých aminokyselinových sekvencií.

Z toho vyplýva jedna veľmi dôležitá myšlienka – GC sa od svojho vzniku pred viac ako 3,5 miliardami rokov takmer nezmenila. To znamená, že jeho štruktúra nesie stopu svojho pôvodu a analýza tejto štruktúry môže pomôcť pochopiť, ako presne mohla GC vzniknúť.

V skutočnosti sa HA môže mierne líšiť v baktériách, mitochondriách a jadrovom kóde niektorých nálevníkov a kvasiniek. V súčasnosti existuje minimálne 17 genetických kódov, ktoré sa od kanonického líšia o 1-5 kodónov.Celkovo sa vo všetkých známych variantoch odchýlok od univerzálnej HA používa 18 rôzne náhrady význam kodónu. Najviac odchýlok od štandardného kódu je známych pre mitochondrie - 10. Je pozoruhodné, že mitochondrie stavovcov, plochých červov a ostnatokožcov sú kódované rôznymi kódmi a plesne, prvoky a coelenteráty sú kódované jedným kódom.

Evolučná blízkosť druhov nie je v žiadnom prípade zárukou, že majú podobnú HA. Genetické kódy sa môžu líšiť aj v odlišné typy mykoplazmy (niektoré druhy majú kanonický kód, zatiaľ čo iné sú odlišné). Podobná situácia je pozorovaná pre kvasinky.

Je dôležité poznamenať, že mitochondrie sú potomkami symbiotických organizmov, ktoré sa prispôsobili životu vo vnútri buniek. Majú značne zredukovaný genóm, niektoré z génov sa presunuli do bunkového jadra. Preto zmeny HA u nich už nie sú také dramatické.

Výnimky objavené neskôr sú obzvlášť zaujímavé z evolučného hľadiska, pretože môžu pomôcť objasniť, ako sa kód vyvinul.

Stôl 1.

Mitochondriálne kódy v rôznych organizmoch.

Codon

Všeobecný kód

Mitochondriálne kódy

Stavovce

Bezstavovce

Kvasnice

Rastliny

UGA

STOP

Trp

Trp

Trp

STOP

AUA

Ile

Met

Met

Met

Ile

CUA

Leu

Leu

Leu

Thr

Leu

AGA

Arg

STOP

Ser

Arg

Arg

AGG

Arg

STOP

Ser

Arg

Arg

Tri mechanizmy na zmenu aminokyseliny kódovanej kódom.

Prvým je, keď niektorý kodón nie je použitý (alebo takmer nepoužívaný) niektorým organizmom kvôli nerovnomernému výskytu niektorých nukleotidov (GC-zloženie) alebo kombinácií nukleotidov. Výsledkom je, že takýto kodón môže úplne vymiznúť z používania (napríklad v dôsledku straty zodpovedajúcej tRNA) a neskôr môže byť použitý na kódovanie inej aminokyseliny bez toho, aby došlo k významnému poškodeniu tela. Tento mechanizmus je pravdepodobne zodpovedný za objavenie sa niektorých dialektov kódov v mitochondriách.

Druhým je premena stop kodónu na význam ovoy. V tomto prípade sa v niektorých preložených proteínoch môžu objaviť nejaké prídavky. Situáciu však čiastočne zachraňuje skutočnosť, že mnohé gény často končia nie jedným, ale dvoma stop kodónmi, pretože sú možné chyby v preklade a v ktorých sa stop kodóny čítajú ako aminokyseliny.

Po tretie, je možné, že určité kodóny sa čítajú nejednoznačne, ako je to v prípade niektorých húb.

8 . Konektivita. Nazývajú sa skupiny ekvivalentných kodónov (to znamená kodóny kódujúce rovnakú aminokyselinu). v sérii... HA obsahuje 21 sérií vrátane stop kodónov. V nasledujúcom texte sa pre istotu bude nazývať akákoľvek skupina kodónov pripojený, ak z každého kodónu tejto skupiny je možné prejsť na všetky ostatné kodóny tej istej skupiny postupnými nukleotidovými substitúciami. Z 21 sérií je spojených 18. 2 série obsahujú každý jeden kodón a len 1 séria pre aminokyselinu serín je odpojená a rozdelená na 2 spojené podsérie.


Ryža. 5. Grafy konektivity pre niektoré kódové rady. a - súvislý rad valínu; b - koherentná séria leucínu; serínová séria je nekoherentná, delí sa na dve spojené podsérie. Obrázok je prevzatý z článku V.A. Ratner" Genetický kód ako systém“.

Vlastnosť konektivity možno vysvetliť skutočnosťou, že počas obdobia formovania HA zachytila ​​nové kodóny, ktoré sa minimálne líšili od už používaných.

9. Pravidelnosť vlastnosti aminokyselín na koreňoch tripletov. Všetky aminokyseliny kódované tripletmi posmievača U sú nepolárne, nemajú extrémne vlastnosti a veľkosti a majú alifatické radikály. Všetky triplety s koreňom C majú silné zásady a nimi kódované aminokyseliny sú relatívne malé. Všetky triplety s koreňom A majú slabé bázy a kódujú polárne aminokyseliny nie malých rozmerov. Kodóny s koreňom G sa vyznačujú extrémnymi a abnormálnymi aminokyselinovými a sériovými variantmi. Kódujú najmenšiu aminokyselinu (glycín), najdlhšiu a najplochú (tryptofán), najdlhšiu a najviac "vratú" (arginín), najreaktívnejšiu (cysteín), tvoria abnormálnu podsériu pre serín.

10. Blokovosť. Universal GK je „blokový“ kód. To znamená, že aminokyseliny s podobnými fyzikálno-chemickými vlastnosťami sú kódované kodónmi, ktoré sa navzájom líšia jednou bázou. Blokovosť kódu je jasne viditeľná na nasledujúcom obrázku.


Ryža. 6. Bloková štruktúra Občianskeho zákonníka. Aminokyseliny s alkylovou skupinou sú označené bielou farbou.


Ryža. 7. Farebné znázornenie fyzikálnych a chemických vlastností aminokyselín na základe hodnôt opísaných v knihePobyty "Biochémia"... Vľavo - hydrofóbnosť. Vpravo je schopnosť vytvárať v bielkovine alfa helix. Červená, žltá a modrá farba predstavujú aminokyseliny s vysokou, strednou a nízkou hydrofóbnosťou (vľavo) alebo zodpovedajúcim stupňom schopnosti vytvárať alfa helix (vpravo).

Vlastnosť blokovosti a pravidelnosti možno vysvetliť aj skutočnosťou, že počas obdobia tvorby HA zachytila ​​nové kodóny, ktoré sa minimálne líšili od už používaných kodónov.

Kodóny s rovnakými prvými bázami (predponami kodónov) kódujú aminokyseliny s podobnými biosyntetickými dráhami. Kodóny aminokyselín patriacich do šikimátových, pyruvátových, aspartátových a glutamátových rodín majú predponu U, G, A a C, v tomto poradí. Pre cesty starovekej biosyntézy aminokyselín a jej spojenie s vlastnosťami moderného kódu pozri „Staroveký dublet genetický kód bola predurčená cestami pre syntézu aminokyselín." Na základe týchto údajov niektorí výskumníci usudzujú, že na tvorbu kódu mali veľký vplyv biosyntetické vzťahy medzi aminokyselinami. Podobnosť biosyntetických dráh však neznamená podobnosť fyzikálno-chemické vlastnosti.

11. Imunita. Vo veľmi všeobecný pohľadšumová imunita HA znamená, že s náhodnými bodovými mutáciami a chybami prekladu sa veľmi nemenia fyzikálno-chemické vlastnosti aminokyseliny.

Substitúcia jedného nukleotidu v triplete vo väčšine prípadov buď nevedie k substitúcii kódovanej aminokyseliny, alebo vedie k substitúcii za aminokyselinu s rovnakou polaritou.

Jedným z mechanizmov zabezpečujúcich protihlukovú imunitu HA je jej degenerácia. Priemerná degenerácia sa rovná - počet kódovaných signálov / celkový počet kodónov, kde kódované signály zahŕňajú 20 aminokyselín a znak ukončenia translácie a. Priemerná degenerácia pre všetky aminokyseliny a znak ukončenia sú tri kodóny na kódovaný signál.

Aby sme kvantifikovali odolnosť voči šumu, zavedieme dva pojmy. Mutácie nukleotidových substitúcií, ktoré nevedú k zmene triedy kódovanej aminokyseliny, sa nazývajú konzervatívny. Nukleotidové substitučné mutácie vedúce k zmene triedy kódovanej aminokyseliny sa nazývajú radikálny .

Každý triplet umožňuje 9 jednotlivých substitúcií. Celkovo existuje 61 tripletov kódujúcich aminokyseliny. Počet možných nukleotidových substitúcií pre všetky kodóny je preto

61 x 9 = 549. Z toho:

Výsledkom 23 nukleotidových substitúcií sú stop kodóny.

134 substitúcií nemení kódovanú aminokyselinu.
230 substitúcií nemení triedu kódovanej aminokyseliny.
162 substitúcií vedie k zmene v triede aminokyselín, t.j. sú radikálne.
Zo 183 3. nukleotidových substitúcií 7 vedie k terminátorom translácie a 176 je konzervovaných.
Zo 183 substitúcií 1. nukleotidu vedie 9 k objaveniu sa terminátorov, 114 je konzervatívnych a 60 je radikálnych.
Zo 183 substitúcií 2. nukleotidu vedie 7 k výskytu terminátorov, 74 je konzervatívnych, 102 je radikálnych.

Na základe týchto výpočtov získame kvantitatívny odhad šumovej imunity kódu ako pomer počtu konzervatívnych substitúcií k počtu radikálnych substitúcií. Rovná sa 364/162 = 2,25

Pri realistickom hodnotení podielu degenerácie na hlukovej imunite je potrebné brať do úvahy frekvenciu výskytu aminokyselín v bielkovinách, ktorá je u rôznych druhov rôzna.

Aký je dôvod odolnosti kódu proti šumu? Väčšina výskumníkov sa domnieva, že táto vlastnosť je dôsledkom výberu alternatívnych HA.

Stephen Freeland a Lawrence Hirst vygenerovali náhodné takéto kódy a zistili, že iba jeden zo sto alternatívnych kódov nemá o nič menšiu odolnosť voči šumu ako univerzálny GC.
Ešte viac zaujímavý fakt objavili, keď títo výskumníci zaviedli ďalšie obmedzenie, aby sa zohľadnili skutočné trendy v povahe mutácie DNA a výskyt chýb v preklade a. Za takýchto podmienok sa LEN JEDEN KÓD Z MILIÓNA MOŽNÝCH ukázal byť lepším ako kanonický kód.
Takáto bezprecedentná vitalita genetického kódu sa dá najľahšie vysvetliť tým, že vznikol v dôsledku prirodzený výber... Možno, že v určitom období v biologickom svete existovalo veľa kódov, z ktorých každý mal svoju vlastnú citlivosť na chyby. Organizmus, ktorý sa s nimi lepšie vyrovnal, mal väčšiu šancu na prežitie a kanonický kódex jednoducho vyhral boj o existenciu. Tento predpoklad sa zdá byť celkom reálny – napokon vieme, že alternatívne kódy existujú. Viac podrobností o odolnosti voči šumu nájdete v Coded evolution (S. Freeland, L. Hirst "Coded evolution". // Vo svete vedy. - 2004, č. 7).

Na záver navrhujem spočítať počet možných genetických kódov, ktoré možno vygenerovať pre 20 kanonických aminokyselín. Toto číslo mi z nejakého dôvodu nikde nenarazilo. Potrebujeme teda mať 20 aminokyselín a stop signál zakódovaný MINIMÁLNE JEDNÝM KÓDOM vo vygenerovanej HA.

Mentálne očíslujeme kodóny v určitom poradí. Budeme argumentovať nasledovne. Ak máme presne 21 kodónov, potom každá aminokyselina a stop signál obsadí presne jeden kodón. V tomto prípade bude možných 21 GC!

Ak existuje 22 kodónov, objaví sa ďalší kodón, ktorý môže mať jeden z 21 významov s a tento kodón sa môže nachádzať na ktoromkoľvek z 22 miest, zatiaľ čo ostatné kodóny majú presne jeden odlišný význam y, ako v prípade 21 kodónov. Potom dostaneme počet kombinácií 21 X (21x22).

Ak existuje 23 kodónov, potom podobným argumentom zistíme, že 21 kodónov má práve jeden odlišný význam s (21! Varianty) a dva kodóny majú 21 rôznych významov a (21 2 významy s s PEVNOU pozíciou týchto kodónov ). Počet rôznych pozícií pre tieto dva kodóny bude 23x22. Celkový počet variantov HA pre 23 kodónov je 21! X21 2 x 23 x 22

Ak existuje 24 kodónov, potom počet HA bude 21! X21 3 x 24 x 23 x 22, ...

....................................................................................................................

Ak existuje 64 kodónov, potom počet možných GC bude 21! X21 43 x 64! / 21! = 21 43 x 64! ~ 9,1 x 10 145

Pod genetickým kódom je zvykom rozumieť taký systém znakov označujúci postupné usporiadanie nukleotidových zlúčenín v DNA a RNA, ktorý zodpovedá inému znakovému systému, ktorý zobrazuje poradie aminokyselinových zlúčenín v molekule proteínu.

To je dôležité!

Keď sa vedcom podarilo študovať vlastnosti genetického kódu, univerzálnosť bola uznaná za jednu z hlavných. Áno, akokoľvek zvláštne to znie, všetko spája jeden, univerzálny, spoločný genetický kód. Vznikol v dlhom časovom intervale a proces sa skončil asi pred 3,5 miliardami rokov. Následne v štruktúre kódu možno vysledovať stopy jeho vývoja, od okamihu vzniku až po súčasnosť.

Keď hovoríme o postupnosti usporiadania prvkov v genetickom kóde, znamená to, že zďaleka nie je chaotické, ale má prísne určitý poriadok... A to do značnej miery určuje aj vlastnosti genetického kódu. To je ekvivalentné usporiadaniu písmen a slabík v slovách. Zaužívaný poriadok sa oplatí porušiť a väčšina z toho, čo čítame na stránkach kníh či novín, sa premení na smiešny gýč.

Základné vlastnosti genetického kódu

Kód zvyčajne obsahuje niektoré informácie zašifrované špeciálnym spôsobom. Aby ste mohli dešifrovať kód, musíte vedieť charakteristické rysy.

Takže hlavné vlastnosti genetického kódu sú:

  • trojitosť;
  • degenerácia alebo nadbytočnosť;
  • jednoznačnosť;
  • kontinuita;
  • už vyššie spomínaná univerzálnosť.

Poďme sa venovať každej nehnuteľnosti podrobnejšie.

1. Trojčatá

To je, keď tri zlúčeniny nukleotidov tvoria sekvenčný reťazec v molekule (t. j. DNA alebo RNA). V dôsledku toho sa vytvorí tripletová zlúčenina alebo kóduje jednu z aminokyselín, jej umiestnenie v peptidovom reťazci.

Rozlišujte medzi kodónmi (to sú tiež kódové slová!) podľa ich sekvencie spojenia a podľa typu tých dusíkatých zlúčenín (nukleotidov), ktoré sú ich súčasťou.

V genetike je zvykom rozlišovať 64 typov kodónov. Môžu vytvárať kombinácie štyri typy nukleotidy, každý po 3. To sa rovná zvýšeniu čísla 4 na tretiu mocninu. Takto je možná tvorba 64 nukleotidových kombinácií.

2. Redundancia genetického kódu

Túto vlastnosť možno vysledovať, keď je potrebných niekoľko kodónov na zakódovanie jednej aminokyseliny, zvyčajne v rozsahu 2-6. A iba tryptofán môže byť zakódovaný jediným tripletom.

3. Jednoznačnosť

Je zahrnutá vo vlastnostiach genetického kódu ako indikátor zdravej genetickej dedičnosti. Napríklad triplet GAA, ktorý je v reťazci na šiestom mieste, môže lekárom povedať o dobrom stave krvi, o normálnom hemoglobíne. Je to on, kto nesie informáciu o hemoglobíne a je ním aj zakódovaná.A ak je človek chorý na anémiu, jeden z nukleotidov je nahradený iným písmenom kódu - Y, čo je signál choroby.

4. Kontinuita

Pri zaznamenávaní tejto vlastnosti genetického kódu treba pamätať na to, že kodóny, podobne ako reťazové články, nie sú umiestnené vo vzdialenosti, ale v priamej blízkosti, jeden po druhom v reťazci nukleovej kyseliny a tento reťazec nie je prerušený - má žiadny začiatok ani koniec.

5. Všestrannosť

Nikdy by sme nemali zabúdať, že všetko na Zemi spája spoločný genetický kód. A preto u primáta a človeka, u hmyzu a vtáka, storočného baobabu a stebla trávy, ktoré sa sotva vyliahlo spod zeme, sú podobné aminokyseliny zakódované rovnakými tripletmi.

Práve v génoch sú položené základné informácie o vlastnostiach organizmu, akýsi program, ktorý organizmus preberá od tých, ktorí žili skôr a ktorý existuje ako genetický kód.

- jednotný systém zaznamenávania dedičnej informácie v molekulách nukleových kyselín vo forme sekvencie nukleotidov. Genetický kód je založený na použití abecedy pozostávajúcej iba zo štyroch písmen-nukleotidov, ktoré sa líšia dusíkatými bázami: A, T, G, C.

Hlavné vlastnosti genetického kódu sú nasledovné:

1. Genetický kód je triplet. Triplet (kodón) - sekvencia troch nukleotidov, ktorá kóduje jednu aminokyselinu. Keďže proteíny obsahujú 20 aminokyselín, je zrejmé, že každá z nich nemôže byť kódovaná jedným nukleotidom (keďže v DNA sú len štyri typy nukleotidov, v tomto prípade zostáva nekódovaných 16 aminokyselín). Dva nukleotidy tiež chýbajú na kódovanie aminokyselín, pretože v tomto prípade môže byť kódovaných iba 16 aminokyselín. znamená, najmenšie číslo nukleotidov kódujúcich jednu aminokyselinu sa rovná trom. (V tomto prípade je počet možných tripletov nukleotidov 4 3 = 64).

2. Redundancia (degenerácia) kódu je dôsledkom jeho tripletnosti a znamená, že jedna aminokyselina môže byť kódovaná viacerými tripletmi (keďže aminokyseliny sú 20 a triplety 64). Výnimkou sú metionín a tryptofán, ktoré sú kódované iba jedným tripletom. Niektoré trojčatá majú navyše špecifické funkcie. V molekule mRNA sú teda tri z nich, UAA, UAH a UGA, terminačné kodóny, teda stop signály, ktoré zastavujú syntézu polypeptidového reťazca. Triplet zodpovedajúci metionínu (AUG), nachádzajúci sa na začiatku reťazca DNA, nekóduje aminokyselinu, ale plní funkciu iniciácie (excitácie) čítania.

3. Súčasne s redundanciou má kód vlastnosť jednoznačnosti, čo znamená, že každý kodón zodpovedá len jednej konkrétnej aminokyseline.

4. Kód je kolineárny; sekvencia nukleotidov v géne sa presne zhoduje so sekvenciou aminokyselín v proteíne.

5. Genetický kód sa neprekrýva a je kompaktný, to znamená, že neobsahuje „interpunkčné znamienka“. To znamená, že proces čítania nepripúšťa možnosť prekrývania stĺpcov (tripletov) a od určitého kodónu čítanie pokračuje nepretržite, triplet po triplete, až po stop signály (terminačné kodóny). Napríklad v mRNA budú nasledujúcu sekvenciu dusíkatých báz AUGGUGTSUUAAUGUG čítať iba takéto triplety: AUG, GUG, CUU, AAU, GUG, a nie AUG, UGG, GGU, GUG atď. alebo AUG, GGU, UGC, CUU atď. alebo nejakým iným spôsobom (napríklad kodón AUG, interpunkčné znamienko G, kodón UGC, interpunkčné znamienko U atď.).

6. Genetický kód je univerzálny, to znamená, že jadrové gény všetkých organizmov kódujú informácie o bielkovinách rovnakým spôsobom, bez ohľadu na úroveň organizácie a systematické postavenie týchto organizmov.

Zdieľajte to