hogyan lehet kiszámítani a fehérje-kódoló gének nem szinonim-szinonim arányarányát a Fisher–Wright mutáció–szelekciós keret alatt

Bevezetés

Halpern & Bruno kidolgozott egy modellt a fehérje-kódoló gének divergenciájának tanulmányozására a Fisher–Wright mutációs modell alapján, a szelekciós modell alapján és véletlenszerű genetikai sodródás . A modellben a gén minden egyes kodonhelyéhez saját aminosav-illesztési készletet rendelnek, majd a Fisher-Wright modellt használják a hely evolúciós sebességének kidolgozására. A modell az utóbbi években újjáéledt, és variációit alkalmazták például a filogenetikai következtetési módszerek teljesítményének tanulmányozására, a kodonhasználat tanulmányozására és a szelekciós együtthatók eloszlásának becslésére a fehérjét kódoló génekben . Talán meglepő, hogy a modellt nem használták a fehérjét kódoló gének nem szinonim-szinonim arányának dinamikájának (más néven) tanulmányozására, valamint annak jelentőségére az adaptív molekuláris evolúció tanulmányozásában.

ennek a megjegyzésnek az a célja, hogy javaslatot tegyen a Halpern & Bruno mutáció-szelekciós modelljének a nem szinonim–szinonim Arány klasszikus fogalmának megfelelő meghatározására és kiszámítására . Reméljük, hogy a populációgenetika első alapelveinek felhasználásával megszerezhetjük az expressziót a fehérje-kódoló gén kodonhelyein ható szelekciós együtthatók függvényében. Ennek sok betekintést kell nyújtania a kodonhelyek evolúciós dinamikájába, és előnyösnek kell lennie a statisztikai modellek felépítésében a fehérje-kódoló gének adaptív evolúciójának kimutatására.

A helyszín szerinti mutáció-szelekciós modell

Tekintsük a kodon helyének fejlődését k egy fehérjét kódoló génben egy n haploid genomú populációban. Tegyük fel, hogy a hely jelenleg az I kodonhoz van rögzítve (azaz az összes n allél hordozza az I-t a K oldalon). A mutáció–szelekciós keretrendszerben a szubsztitúciós ráta (az a sebesség , amellyel az új mutáns kodonok J megjelennek és végül rögzülnek a populációban)

megjelenítési képlet

2.1

itt a (generációnként) I – től J-ig terjedő semleges mutációs ráta, SIJ,k = FJ,k-FI,k pedig a J és FJ kodon javára történő szelekciós együttható,k = 2nfj,k a skálázott malthusi alkalmasság nak, – nek J. a természetes szelekció befolyásolja a relatív helyettesítési arányt. Ha a mutáció előnyös (SIJ,k > 0), akkor a szubsztitúciós arány magasabb,mint a semleges arány (qIJ, k > XXIII), de ha a mutáció káros (SIJ, k < 0), akkor a szubsztitúciós arány csökken (qij, k <). Itt feltételezzük, hogy a szinonim szubsztitúciók semlegesek (SIJ,k = 0), így a K helyszínen az evolúciót 20 aminosav-illesztés határozza meg. A DNA-szubsztitúciós modellekből (például, ha I = TTT és J = TTC, akkor

Inline Formulaa HKY szubsztitúciós modell alatt, lásd a részleteket).

egyenlet (2.1) a kodon szubsztitúciót a populációkban folyamatos idejű Markov-folyamatként írja le. Ez akkor ésszerű, ha a generációnkénti mutációs arány kicsi a populáció méretéhez képest (Inline Formula), így a populációban kevés a polimorfizmus, és legfeljebb két allél különül el egy helyen egy időben. Az idő aránya, nI,k, hogy a hely k tölti fix I (azaz a helyhez kötött frekvencia I) van

kijelző Formula

, aholInline Formulaa frekvencia egy semlegesen fejlődő szekvencia (azaz pszeudo-gén). Így a helyettesítési Arány k-nál, az idő múlásával átlagolva,

megjelenítési képlet

ahol az összeg az összes kodonpár felett van I. J. ez az arány felosztható a nem szinonim és szinonim komponens arányokra, pk = pN, k + pS,k,ahol

megjelenítési képlet

és ahol az indikátor függvény = 1, ha a helyettesítés nem szinonim, és = 0, ha más. Vegye figyelembe,hogy a szinonim Arány pS, k helyenként változik (például ha egy helyet konzerválnak a metionin számára, akkor a szinonim Arány nulla). Egy semlegesen fejlődő szekvencia esetében az arányokat a

megjelenítési képlet

vegye figyelembe, hogy a (2.1) egyenlet megadja a pillanatnyi helyettesítési sebességet, vagyis a K helyszínen kondicionált sebességet, amelyet jelenleg i-re rögzítenek. Másrészt a pk az egyensúlyi sebesség, az összes kodonra átlagolva, helyhez kötött frekvenciájukkal súlyozva.

a relatív nem szinonim helyettesítési Arány

az abszolút nem szinonim A szinonim helyettesítési arány aránya a k helyen pN,k/pS,k. Mivel azonban a szinonim arányok webhelyenként változnak, normalizálnunk kell az arányt a webhely szinonim arányával, Inline Formula, majd normalizálni kell Inline Formula (hogy korrigálja a A szinonim és nem szinonim helyettesítések különböző arányai a semlegességnél). Ez a következő meghatározáshoz vezet:

megjelenítési képlet

3.1

Alternatív megoldásként meghatározhatjuk a wk-t a relatív nem szinonim sebességként wk = cpN,k ahol állandó c úgy van beállítva, hogy az arány egy legyen a semlegesen fejlődő szekvenciák esetében, vagyis a kényszer alatt Inline képlet. A nyilvánvaló megoldás a Inline Formula, amely a fenti definícióhoz vezet. Vegye figyelembe, hogy a c kívánatos tulajdonsága, hogy állandó a webhelyeken. Az olvasónak nem szabad meglepődnie, hogy a szinonim Arány kiesik a (3.1) egyenletből. Statisztikai következtetés során a szinonim szubsztitúciók információkat tartalmaznak a semleges mutációs arányokról, így tájékoztatják a Inline Formulaértékét. Hasonlóképpen, a relatív szinonim arány a K helyen

megjelenítési képlet

3.2

az 1a ábra példát mutat a virágos növények rbcL génjére. A fitnesz értékeket a Halpern–Bruno modell alapján becsülték meg Tamuri et al. , és az értékeiket használjuk a wk és yk kiszámításához itt. A helyek átlagos aránya

Inline FormulaésInline Formula. Vegye figyelembe, hogy sok helyen a szinonim arányok gyorsabbak, mint egy semlegesen fejlődő szekvencia esetében (azaz yk > 1). Ennek oka a genetikai kód furcsa jellege a mutációs torzításokkal párosulva (Inline Formula

1.ábra.

1. ábra. A relatív nem szinonim (wk) és szinonim (YK) helyettesítési arányok. a) az egyszikűek (virágos növények) rbcl kloroplaszt génjének aránya. (b) az influenza A. in (a,b) PB2 génjének arányát, az egyes helyek alkalmasságát (FIJ,k) és a mutációs paramétereket (Inline Formula) A Halpern–Bruno modell szerint megbecsülték a büntetési valószínűség alapján (büntetés). Ezután a (3.1) és (3.2) egyenleteket használjuk a wk és yk kiszámításához. A b) pontban 25 adaptív helyet (vörös) azonosítottak, ahol az alkalmasság különbözik az emberben kialakuló vírusok és a madár (a természetes víztározó) gazdaszervezetek között . Ezeknek a helyeknek az egyes házigazdák alatt való alkalmasságát büntetés nélkül becsülték meg. Ezután a (4.1) egyenletet használjuk a inline Formula kiszámításához a gazdagép eltolásakor. A Inline Formula tartománya 0,231–7,64 (a legnagyobb értékeket az ábra csonkolja).

a nem szinonim arány az adaptív evolúció során

amikor az aminosavak illeszkedése állandó az időben, a helyek az optimális aminosavhoz rögzített idő nagy részét töltik. Időnként a szuboptimális aminosavak rögzíthetők, majd rövid evolúciós idő után helyettesíthetők. Ez azt jelenti, hogy a nem szinonim arány a helyszíneken csökken a semlegesen fejlődő szekvenciák arányához képest (azaz wk < 1). Ha azonban a helyek alkalmassága idővel változik (például környezeti eltolás után vagy intenzív frekvenciafüggő kiválasztás alatt), a nem szinonim sebesség felgyorsulhat a semlegesen fejlődő szekvenciák sebességéhez képest (wk > 1). Most azt az esetet tanulmányozzuk, amikor az alkalmasság megváltozik, mint egy új környezethez való alkalmazkodás.

Vegyünk egy K helyet, ahol az I alkalmassága Inline Formula az a környezetben. A helyhez kötött frekvenciák és a pillanatnyi helyettesítési arányok Inline Formula. Most képzeljük el, hogy a környezet eltolódik (például egy hirtelen hidegebb éghajlaton élő emlősök populációja, vagy egy új gazdaszervezetet kolonizáló vírus, ahol az új gazdaszervezet intracelluláris környezete eltér a tározó gazdaszervezetétől). Az I alkalmassága az új környezetben B most Inline Formula. Annak a valószínűsége, hogy a hely jelenleg rögzített i-re a környezeti váltás pillanatában Inline Formula, de a helyettesítési arány most az új környezeté Inline Formula. Így a várható abszolút és relatív nem szinonim arányok a környezeti eltolódásnál

megjelenítési képlet

4.1

Ha a fitnesz értékek eltolódása nagy, akkor az arány sokkal felgyorsul (Inline Formula). Ez azért történik, mert a hely valószínűleg egy szuboptimális aminosavhoz kötődik az új környezetben, és az optimális aminosavak új mutációi gyorsan rögzülnek. Ha azonban a fitnesz eltolódás mérsékelt, akkor az arány továbbra is alacsonyabb lehet, mint a semleges arány (Inline Formula).

az 1b.ábra példát mutat az influenzavírus pb2 génjére. A fitnesz értékeket a Halpern–Bruno modell alapján becsülték meg Tamuri et al. . Tamuri et al.25 adaptív hely egy részhalmazát azonosította (ahol az emberi és a madár gazdaszervezetekben kialakuló vírusok alkalmassága eltérő). , és alkalmasságukat Tamuri et al. . A becsléseket használjuk a wk, yk és Inline képlet itt. Az emberi influenza klasszikus származása valószínűleg a gazdaszervezet madárról emlőstározóra való áttéréséből származott a huszadik század elején . We calculate Inline Formula at the putative host shift. The average rate at adaptive sites is Inline Formula (across all sites Inline Formula and Inline Formula). Note that for 16 sites for which fitnesses are different between hosts, we find that Inline Formula. Ez azt jelzi, hogy a WK > 1 kritérium az adaptív evolúció kimutatására ebben az esetben konzervatív.

annak a valószínűsége, hogy a hely rögzített I, idő t után a környezet shift

kijelző képlet

4.2

aholInline képletaz átmenet a standard Markov-elmélettel kapott valószínűségek, azaz ainline formulakiszámításával. Így az abszolút és relatív nem szinonim arányok, az eltolás utáni t idő

megjelenítési képlet

a (4.2) egyenlet átmeneti valószínűségei az idő exponenciális bomlási függvényei, ígyInline Formulaszintén exponenciális bomlás. Kezdetben aInline Formulaértéke magas lesz, és ahogy az idő a végtelenségig tart,Inline Formulamegközelíti a (3.1) egyenlet által megadott álló értéket. Más szavakkal, nem sokkal a környezetváltás után adaptív szubsztitúciók robbanása következik be azokon a helyeken, ahol az illesztések megváltoztak, és a szubsztitúciók addig halmozódnak fel, amíg a fehérjét kódoló gén el nem éri az adaptív egyensúly állapotát. Például a 2A. ábra aInline Formulabomlását mutatja a PB2 gén 25 adaptív helyére gazdaeltolódás után.

2.ábra.

2. ábra. (a) A relatív nem szinonim Arány bomlása a gazdaszervezet eltolódása után 25 adaptív hely (szürke vonalak) az influenza pb2 génjében. A folytonos vonal a 25 oldal átlaga, Inline Formula. Az idő múlásával Inline Formulamegközelíti a hosszú távú átlagot Inline Formula (szaggatott vonal). B) a relatív nem szinonim arány a helyszínek átlagos szelekciós együtthatójának függvényében. Rózsaszín pontok: a 10 000 helyre vonatkozó alkalmassági értékeket a normál eloszlásból, az átlagos 0-val és a 0,…, 10-gyel mintavételezték. Ezután a (3.1) és (5.1) egyenleteket használtuk a wk kiszámításához és Inline Formula. Szürke pontok: egy másik 10 000 alkalmassági értékből álló készletet vettünk fel a fentiek szerint, majd a (4.2) és (5.1) egyenleteket használtuk a Inline Formula és Inline Formula kiszámításához a környezeti váltási modell alatt. Folytonos vonal: S/(1−exp (- S)).

következtetés

a korábbi szerzők kimutatták , hogy a nem szinonim arány és a szelekciós együttható közötti kapcsolat hozzávetőlegesen a(1-exp (−S)), de a közelítés vagy a végtelen helyek modelljére támaszkodik, vagy feltételezi, hogy minden mutáns aminosav azonos alkalmassággal rendelkezik. A (3.1) és (4.1) egyenletek reálisabb közelítéseket nyújtanak, de nehezen vizualizálhatók. Fontolja meg az I számára rögzített webhelyet. Annak a valószínűsége, hogy a következő mutáció J lesz, Inline Formula az I-hez a J. idővel az I-J mutációk aránya a helyszínen nI, kPIJ lesz. Így az átlagos szelekciós együttható a mutációkon a k helyen

megjelenítési képlet

5.1

A 2b ábra a wk-t mutatja aInline képletszimulált helyek esetén állandóak, vagy amikor a környezettel együtt mozognak. Vegye figyelembe, hogy a közelítés kb = s/(1 − exp(−S)) ésszerű alsó határt biztosít a wk-ra. ÁltalábanInline FormulaInline képlet, de a kapcsolat nem olyan egyszerű, mint az előző közelítésekben .

a helyszín szerinti mutáció-szelekciós modellben először a szelekciós együtthatókat számítjuk ki, így a WK kiszámítása nélkül tudhatjuk, hogy egy hely pozitív szelekció alatt volt–e . A modell azonban túlparametrizált, számítási szempontból drága, és az illesztéseket csak nagy adatkészletekben lehet jól megbecsülni . Ehelyett a modellnek előnyösnek kell lennie az evolúciós érvelésben és a modellépítésben. Például a WK viselkedése összetettebb modellek alatt (például frekvenciafüggő szelekció , alkalmazkodás a fokozatos környezeti változásokhoz vagy szelekció a kodonhasználaton ) szintén tanulmányozható a hely szerinti mutáció-szelekciós keretrendszer alatt. Ez értékes erőfeszítés lesz, mivel rávilágít arra, hogy képesek vagyunk kimutatni az adaptív evolúciót a molekuláris szekvenciákban.

az adatok hozzáférhetősége

az ehhez a vizsgálathoz kapcsolódó adatok a Dryad doi:10.5061/dryad címen érhetők el.3r3q4.

köszönetnyilvánítások

köszönöm Ziheng Yang, Richard Goldstein és Asif Tamuri értékes megjegyzéseket.

finanszírozási nyilatkozat

Az M. d. R. – t a BBSRC (UK) támogatás támogatja. BB / J009709 / 1 elnyerte Ziheng Yang.

összeférhetetlenség

nincsenek versengő érdekeim.

lábjegyzetek

2015 a szerző(K) megjelent a Royal Society. Minden jog fenntartva.
  • 1
    Halpern AL& Bruno WJ. 1998evolúciós távolságok a fehérjekódoló szekvenciák számára: helyspecifikus maradékfrekvenciák modellezése. Mol. Biol. Evol. 15, 910–917. (doi: 10.1093 / oxfordjournals.molbev.a025995). Crossref, PubMed, Isi, Google Scholar
  • 2
    Fisher R. 1930a természetes szelekció genetikai elmélete. Oxford, Egyesült Királyság: Clarendon Press. Google Scholar
  • 3
    Wright S. 1931evolution Mendeli populációkban. Genetika 16, 97-159. PubMed, Google Scholar
  • 4
    Holder MT, Zwickl DJ & Dessimoz C. 2008a filogenetikai módszerek robusztusságának értékelése a helyettesítési folyamatok helyszíni változékonysága szempontjából. Phil. Trans. R. Soc. B 363, 4013-4021. (doi: 10.1098 / rstb.2008.0162). Link, Isi, Google Scholar
  • 5
    Spielman SJ & Wilke CO. 2015a dN/dS és a skálázott kiválasztási együtthatók közötti kapcsolat. Mol. Biol. Evol. 32. (doi: 10.1093/molbev / msv003). Crossref, PubMed, Isi, Google Scholar
  • 6
    Yang Z& Nielsen R. 2008mutation–selection modellek kodon szubsztitúció és azok használata becslésére szelektív erőssége kodon használat. Mol. Biol. Evol. 25, 568–579. (doi: 10.1093/molbev / msm284). Crossref, PubMed, ISI, Google Scholar
  • 7
    Rodrigue N, Philippe H & Lartillot N. 2010mutáció–kiválasztási modellek kódoló szekvencia evolúció hely-heterogén aminosav fitness profilok. Proc. Natl Acad. Sci. USA 107, 4629-4634. (doi: 10.1073 / pnas.0910915107). Crossref, PubMed, Isi, Google Scholar
  • 8
    Tamuri AU, dos Reis M & Goldstein RA. 2012A szelekciós együtthatók eloszlásának becslése filogenetikai adatokból sitewise mutáció-szelekciós modellek segítségével. Genetika 190, 1101-1115. (doi: 10.1534 / genetika.111.136432). Crossref, PubMed, ISI, Google Scholar
  • 9
    Tamuri AU, Goldman n & dos Reis M. 2014a büntetett-valószínűségi módszer a szelekciós együtthatók eloszlásának becslésére filogenetikai adatokból. Genetika 197, 257-271. (doi: 10.1534 / genetika.114.162263). Crossref, PubMed, Isi, Google Scholar
  • 10
    dos Reis M. 2013az adaptív evolúció populációs genetikája és szubsztitúciós modelljei. (http://arxiv.org/abs/1311.6682). Google Scholar
  • 11
    Tamuri AU, dos Reis M, Hay aj& Goldstein RA. 2009 a szelektív korlátok változásainak azonosítása: a gazdaszervezetek eltolódása az influenzában. PLoS Comput. Biol. 5, e1000564. (doi: 10.1371 / folyóirat.pcbi.1000564). Crossref, PubMed, Isi, Google Scholar
  • 12
    dos Reis M, Hay aj& Goldstein RA. 2009 a nukleotid szubsztitúció nem homogén modelljeinek alkalmazása a gazdaszervezet-eltolódási események azonosítására: alkalmazás az 1918-as spanyol influenzajárvány vírus eredetére. J. Mol. Evol. 69, 333–345. (doi:10.1007 / s00239-009-9282-x). Crossref, PubMed, Isi, Google Scholar
  • 13
    Nielsen r& Yang Z. 2003becsüli a szelekciós együtthatók eloszlását a filogenetikai adatokból a mitokondriális és vírusos DNS-hez való alkalmazásokkal. Mol. Biol. Evol. 20, 1231–1239. (doi: 10.1093/molbev / msg147). Crossref, PubMed, Isi, Google Scholar
  • 14
    Bustamante CD. 2005a molekuláris evolúció populációs genetikája. Statisztikai módszerek a molekuláris evolúcióban (ed. & Nielsen R), 63-99. New York, új: Springer. Crossref, Google Scholar

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.