Bevezetés
Halpern & Bruno kidolgozott egy modellt a fehérje-kódoló gének divergenciájának tanulmányozására a Fisher–Wright mutációs modell alapján, a szelekciós modell alapján és véletlenszerű genetikai sodródás . A modellben a gén minden egyes kodonhelyéhez saját aminosav-illesztési készletet rendelnek, majd a Fisher-Wright modellt használják a hely evolúciós sebességének kidolgozására. A modell az utóbbi években újjáéledt, és variációit alkalmazták például a filogenetikai következtetési módszerek teljesítményének tanulmányozására, a kodonhasználat tanulmányozására és a szelekciós együtthatók eloszlásának becslésére a fehérjét kódoló génekben . Talán meglepő, hogy a modellt nem használták a fehérjét kódoló gének nem szinonim-szinonim arányának dinamikájának (más néven) tanulmányozására, valamint annak jelentőségére az adaptív molekuláris evolúció tanulmányozásában.
ennek a megjegyzésnek az a célja, hogy javaslatot tegyen a Halpern & Bruno mutáció-szelekciós modelljének a nem szinonim–szinonim Arány klasszikus fogalmának megfelelő meghatározására és kiszámítására . Reméljük, hogy a populációgenetika első alapelveinek felhasználásával megszerezhetjük az expressziót a fehérje-kódoló gén kodonhelyein ható szelekciós együtthatók függvényében. Ennek sok betekintést kell nyújtania a kodonhelyek evolúciós dinamikájába, és előnyösnek kell lennie a statisztikai modellek felépítésében a fehérje-kódoló gének adaptív evolúciójának kimutatására.
A helyszín szerinti mutáció-szelekciós modell
Tekintsük a kodon helyének fejlődését k egy fehérjét kódoló génben egy n haploid genomú populációban. Tegyük fel, hogy a hely jelenleg az I kodonhoz van rögzítve (azaz az összes n allél hordozza az I-t a K oldalon). A mutáció–szelekciós keretrendszerben a szubsztitúciós ráta (az a sebesség , amellyel az új mutáns kodonok J megjelennek és végül rögzülnek a populációban)
itt a (generációnként) I – től J-ig terjedő semleges mutációs ráta, SIJ,k = FJ,k-FI,k pedig a J és FJ kodon javára történő szelekciós együttható,k = 2nfj,k a skálázott malthusi alkalmasság nak, – nek J. a természetes szelekció befolyásolja a relatív helyettesítési arányt. Ha a mutáció előnyös (SIJ,k > 0), akkor a szubsztitúciós arány magasabb,mint a semleges arány (qIJ, k > XXIII), de ha a mutáció káros (SIJ, k < 0), akkor a szubsztitúciós arány csökken (qij, k <). Itt feltételezzük, hogy a szinonim szubsztitúciók semlegesek (SIJ,k = 0), így a K helyszínen az evolúciót 20 aminosav-illesztés határozza meg. A DNA-szubsztitúciós modellekből (például, ha I = TTT és J = TTC, akkor
a HKY szubsztitúciós modell alatt, lásd a részleteket).
egyenlet (2.1) a kodon szubsztitúciót a populációkban folyamatos idejű Markov-folyamatként írja le. Ez akkor ésszerű, ha a generációnkénti mutációs arány kicsi a populáció méretéhez képest (), így a populációban kevés a polimorfizmus, és legfeljebb két allél különül el egy helyen egy időben. Az idő aránya, nI,k, hogy a hely k tölti fix I (azaz a helyhez kötött frekvencia I) van
, ahola frekvencia egy semlegesen fejlődő szekvencia (azaz pszeudo-gén). Így a helyettesítési Arány k-nál, az idő múlásával átlagolva,
ahol az összeg az összes kodonpár felett van I. J. ez az arány felosztható a nem szinonim és szinonim komponens arányokra, pk = pN, k + pS,k,ahol
és ahol az indikátor függvény = 1, ha a helyettesítés nem szinonim, és = 0, ha más. Vegye figyelembe,hogy a szinonim Arány pS, k helyenként változik (például ha egy helyet konzerválnak a metionin számára, akkor a szinonim Arány nulla). Egy semlegesen fejlődő szekvencia esetében az arányokat a
vegye figyelembe, hogy a (2.1) egyenlet megadja a pillanatnyi helyettesítési sebességet, vagyis a K helyszínen kondicionált sebességet, amelyet jelenleg i-re rögzítenek. Másrészt a pk az egyensúlyi sebesség, az összes kodonra átlagolva, helyhez kötött frekvenciájukkal súlyozva.
a relatív nem szinonim helyettesítési Arány
az abszolút nem szinonim A szinonim helyettesítési arány aránya a k helyen pN,k/pS,k. Mivel azonban a szinonim arányok webhelyenként változnak, normalizálnunk kell az arányt a webhely szinonim arányával, , majd normalizálni kell (hogy korrigálja a A szinonim és nem szinonim helyettesítések különböző arányai a semlegességnél). Ez a következő meghatározáshoz vezet:
Alternatív megoldásként meghatározhatjuk a wk-t a relatív nem szinonim sebességként wk = cpN,k ahol állandó c úgy van beállítva, hogy az arány egy legyen a semlegesen fejlődő szekvenciák esetében, vagyis a kényszer alatt . A nyilvánvaló megoldás a , amely a fenti definícióhoz vezet. Vegye figyelembe, hogy a c kívánatos tulajdonsága, hogy állandó a webhelyeken. Az olvasónak nem szabad meglepődnie, hogy a szinonim Arány kiesik a (3.1) egyenletből. Statisztikai következtetés során a szinonim szubsztitúciók információkat tartalmaznak a semleges mutációs arányokról, így tájékoztatják a értékét. Hasonlóképpen, a relatív szinonim arány a K helyen
az 1a ábra példát mutat a virágos növények rbcL génjére. A fitnesz értékeket a Halpern–Bruno modell alapján becsülték meg Tamuri et al. , és az értékeiket használjuk a wk és yk kiszámításához itt. A helyek átlagos aránya
és. Vegye figyelembe, hogy sok helyen a szinonim arányok gyorsabbak, mint egy semlegesen fejlődő szekvencia esetében (azaz yk > 1). Ennek oka a genetikai kód furcsa jellege a mutációs torzításokkal párosulva (
a nem szinonim arány az adaptív evolúció során
amikor az aminosavak illeszkedése állandó az időben, a helyek az optimális aminosavhoz rögzített idő nagy részét töltik. Időnként a szuboptimális aminosavak rögzíthetők, majd rövid evolúciós idő után helyettesíthetők. Ez azt jelenti, hogy a nem szinonim arány a helyszíneken csökken a semlegesen fejlődő szekvenciák arányához képest (azaz wk < 1). Ha azonban a helyek alkalmassága idővel változik (például környezeti eltolás után vagy intenzív frekvenciafüggő kiválasztás alatt), a nem szinonim sebesség felgyorsulhat a semlegesen fejlődő szekvenciák sebességéhez képest (wk > 1). Most azt az esetet tanulmányozzuk, amikor az alkalmasság megváltozik, mint egy új környezethez való alkalmazkodás.
Vegyünk egy K helyet, ahol az I alkalmassága az a környezetben. A helyhez kötött frekvenciák és a pillanatnyi helyettesítési arányok . Most képzeljük el, hogy a környezet eltolódik (például egy hirtelen hidegebb éghajlaton élő emlősök populációja, vagy egy új gazdaszervezetet kolonizáló vírus, ahol az új gazdaszervezet intracelluláris környezete eltér a tározó gazdaszervezetétől). Az I alkalmassága az új környezetben B most . Annak a valószínűsége, hogy a hely jelenleg rögzített i-re a környezeti váltás pillanatában , de a helyettesítési arány most az új környezeté . Így a várható abszolút és relatív nem szinonim arányok a környezeti eltolódásnál
Ha a fitnesz értékek eltolódása nagy, akkor az arány sokkal felgyorsul (). Ez azért történik, mert a hely valószínűleg egy szuboptimális aminosavhoz kötődik az új környezetben, és az optimális aminosavak új mutációi gyorsan rögzülnek. Ha azonban a fitnesz eltolódás mérsékelt, akkor az arány továbbra is alacsonyabb lehet, mint a semleges arány ().
az 1b.ábra példát mutat az influenzavírus pb2 génjére. A fitnesz értékeket a Halpern–Bruno modell alapján becsülték meg Tamuri et al. . Tamuri et al.25 adaptív hely egy részhalmazát azonosította (ahol az emberi és a madár gazdaszervezetekben kialakuló vírusok alkalmassága eltérő). , és alkalmasságukat Tamuri et al. . A becsléseket használjuk a wk, yk és itt. Az emberi influenza klasszikus származása valószínűleg a gazdaszervezet madárról emlőstározóra való áttéréséből származott a huszadik század elején . We calculate at the putative host shift. The average rate at adaptive sites is (across all sites and ). Note that for 16 sites for which fitnesses are different between hosts, we find that . Ez azt jelzi, hogy a WK > 1 kritérium az adaptív evolúció kimutatására ebben az esetben konzervatív.
annak a valószínűsége, hogy a hely rögzített I, idő t után a környezet shift
aholaz átmenet a standard Markov-elmélettel kapott valószínűségek, azaz akiszámításával. Így az abszolút és relatív nem szinonim arányok, az eltolás utáni t idő
a (4.2) egyenlet átmeneti valószínűségei az idő exponenciális bomlási függvényei, ígyszintén exponenciális bomlás. Kezdetben aértéke magas lesz, és ahogy az idő a végtelenségig tart,megközelíti a (3.1) egyenlet által megadott álló értéket. Más szavakkal, nem sokkal a környezetváltás után adaptív szubsztitúciók robbanása következik be azokon a helyeken, ahol az illesztések megváltoztak, és a szubsztitúciók addig halmozódnak fel, amíg a fehérjét kódoló gén el nem éri az adaptív egyensúly állapotát. Például a 2A. ábra abomlását mutatja a PB2 gén 25 adaptív helyére gazdaeltolódás után.
következtetés
a korábbi szerzők kimutatták , hogy a nem szinonim arány és a szelekciós együttható közötti kapcsolat hozzávetőlegesen a(1-exp (−S)), de a közelítés vagy a végtelen helyek modelljére támaszkodik, vagy feltételezi, hogy minden mutáns aminosav azonos alkalmassággal rendelkezik. A (3.1) és (4.1) egyenletek reálisabb közelítéseket nyújtanak, de nehezen vizualizálhatók. Fontolja meg az I számára rögzített webhelyet. Annak a valószínűsége, hogy a következő mutáció J lesz, az I-hez a J. idővel az I-J mutációk aránya a helyszínen nI, kPIJ lesz. Így az átlagos szelekciós együttható a mutációkon a k helyen
A 2b ábra a wk-t mutatja aszimulált helyek esetén állandóak, vagy amikor a környezettel együtt mozognak. Vegye figyelembe, hogy a közelítés kb = s/(1 − exp(−S)) ésszerű alsó határt biztosít a wk-ra. Általában, de a kapcsolat nem olyan egyszerű, mint az előző közelítésekben .
a helyszín szerinti mutáció-szelekciós modellben először a szelekciós együtthatókat számítjuk ki, így a WK kiszámítása nélkül tudhatjuk, hogy egy hely pozitív szelekció alatt volt–e . A modell azonban túlparametrizált, számítási szempontból drága, és az illesztéseket csak nagy adatkészletekben lehet jól megbecsülni . Ehelyett a modellnek előnyösnek kell lennie az evolúciós érvelésben és a modellépítésben. Például a WK viselkedése összetettebb modellek alatt (például frekvenciafüggő szelekció , alkalmazkodás a fokozatos környezeti változásokhoz vagy szelekció a kodonhasználaton ) szintén tanulmányozható a hely szerinti mutáció-szelekciós keretrendszer alatt. Ez értékes erőfeszítés lesz, mivel rávilágít arra, hogy képesek vagyunk kimutatni az adaptív evolúciót a molekuláris szekvenciákban.
az adatok hozzáférhetősége
az ehhez a vizsgálathoz kapcsolódó adatok a Dryad doi:10.5061/dryad címen érhetők el.3r3q4.
köszönetnyilvánítások
köszönöm Ziheng Yang, Richard Goldstein és Asif Tamuri értékes megjegyzéseket.
finanszírozási nyilatkozat
Az M. d. R. – t a BBSRC (UK) támogatás támogatja. BB / J009709 / 1 elnyerte Ziheng Yang.
összeférhetetlenség
nincsenek versengő érdekeim.
lábjegyzetek
- 1
Halpern AL& Bruno WJ. 1998evolúciós távolságok a fehérjekódoló szekvenciák számára: helyspecifikus maradékfrekvenciák modellezése. Mol. Biol. Evol. 15, 910–917. (doi: 10.1093 / oxfordjournals.molbev.a025995). Crossref, PubMed, Isi, Google Scholar
- 2
Fisher R. 1930a természetes szelekció genetikai elmélete. Oxford, Egyesült Királyság: Clarendon Press. Google Scholar
- 3
Wright S. 1931evolution Mendeli populációkban. Genetika 16, 97-159. PubMed, Google Scholar
- 4
Holder MT, Zwickl DJ & Dessimoz C. 2008a filogenetikai módszerek robusztusságának értékelése a helyettesítési folyamatok helyszíni változékonysága szempontjából. Phil. Trans. R. Soc. B 363, 4013-4021. (doi: 10.1098 / rstb.2008.0162). Link, Isi, Google Scholar
- 5
Spielman SJ & Wilke CO. 2015a dN/dS és a skálázott kiválasztási együtthatók közötti kapcsolat. Mol. Biol. Evol. 32. (doi: 10.1093/molbev / msv003). Crossref, PubMed, Isi, Google Scholar
- 6
Yang Z& Nielsen R. 2008mutation–selection modellek kodon szubsztitúció és azok használata becslésére szelektív erőssége kodon használat. Mol. Biol. Evol. 25, 568–579. (doi: 10.1093/molbev / msm284). Crossref, PubMed, ISI, Google Scholar
- 7
Rodrigue N, Philippe H & Lartillot N. 2010mutáció–kiválasztási modellek kódoló szekvencia evolúció hely-heterogén aminosav fitness profilok. Proc. Natl Acad. Sci. USA 107, 4629-4634. (doi: 10.1073 / pnas.0910915107). Crossref, PubMed, Isi, Google Scholar
- 8
Tamuri AU, dos Reis M & Goldstein RA. 2012A szelekciós együtthatók eloszlásának becslése filogenetikai adatokból sitewise mutáció-szelekciós modellek segítségével. Genetika 190, 1101-1115. (doi: 10.1534 / genetika.111.136432). Crossref, PubMed, ISI, Google Scholar
- 9
Tamuri AU, Goldman n & dos Reis M. 2014a büntetett-valószínűségi módszer a szelekciós együtthatók eloszlásának becslésére filogenetikai adatokból. Genetika 197, 257-271. (doi: 10.1534 / genetika.114.162263). Crossref, PubMed, Isi, Google Scholar
- 10
dos Reis M. 2013az adaptív evolúció populációs genetikája és szubsztitúciós modelljei. (http://arxiv.org/abs/1311.6682). Google Scholar
- 11
Tamuri AU, dos Reis M, Hay aj& Goldstein RA. 2009 a szelektív korlátok változásainak azonosítása: a gazdaszervezetek eltolódása az influenzában. PLoS Comput. Biol. 5, e1000564. (doi: 10.1371 / folyóirat.pcbi.1000564). Crossref, PubMed, Isi, Google Scholar
- 12
dos Reis M, Hay aj& Goldstein RA. 2009 a nukleotid szubsztitúció nem homogén modelljeinek alkalmazása a gazdaszervezet-eltolódási események azonosítására: alkalmazás az 1918-as spanyol influenzajárvány vírus eredetére. J. Mol. Evol. 69, 333–345. (doi:10.1007 / s00239-009-9282-x). Crossref, PubMed, Isi, Google Scholar
- 13
Nielsen r& Yang Z. 2003becsüli a szelekciós együtthatók eloszlását a filogenetikai adatokból a mitokondriális és vírusos DNS-hez való alkalmazásokkal. Mol. Biol. Evol. 20, 1231–1239. (doi: 10.1093/molbev / msg147). Crossref, PubMed, Isi, Google Scholar
- 14
Bustamante CD. 2005a molekuláris evolúció populációs genetikája. Statisztikai módszerek a molekuláris evolúcióban (ed. & Nielsen R), 63-99. New York, új: Springer. Crossref, Google Scholar