Hogyan lehet kiszámítani a fehérje-kódoló gének nem szinonim-szinonim arányarányát a Fisher–Wright mutáció–szelekciós keret alatt

Bevezetés

Halpern & Bruno kidolgozott egy modellt a fehérje-kódoló gének divergenciájának tanulmányozására a Fisher–Wright mutációs modell alapján, a szelekciós modell alapján és véletlenszerű genetikai sodródás . A modellben a gén minden egyes kodonhelyéhez saját aminosav-illesztési készletet rendelnek, majd a Fisher-Wright modellt használják a hely evolúciós sebességének kidolgozására. A modell az utóbbi években újjáéledt, és variációit alkalmazták például a filogenetikai következtetési módszerek teljesítményének tanulmányozására, a kodonhasználat tanulmányozására és a szelekciós együtthatók eloszlásának becslésére a fehérjét kódoló génekben . Talán meglepő, hogy a modellt nem használták a fehérjét kódoló gének nem szinonim-szinonim arányának dinamikájának (más néven) tanulmányozására, valamint annak jelentőségére az adaptív molekuláris evolúció tanulmányozásában.

ennek a megjegyzésnek az a célja, hogy javaslatot tegyen a Halpern & Bruno mutáció-szelekciós modelljének a nem szinonim–szinonim Arány klasszikus fogalmának megfelelő meghatározására és kiszámítására . Reméljük, hogy a populációgenetika első alapelveinek felhasználásával megszerezhetjük az expressziót a fehérje-kódoló gén kodonhelyein ható szelekciós együtthatók függvényében. Ennek sok betekintést kell nyújtania a kodonhelyek evolúciós dinamikájába, és előnyösnek kell lennie a statisztikai modellek felépítésében a fehérje-kódoló gének adaptív evolúciójának kimutatására.

A helyszín szerinti mutáció-szelekciós modell

Tekintsük a kodon helyének fejlődését k egy fehérjét kódoló génben egy n haploid genomú populációban. Tegyük fel, hogy a hely jelenleg az I kodonhoz van rögzítve (azaz az összes n allél hordozza az I-t a K oldalon). A mutáció–szelekciós keretrendszerben a szubsztitúciós ráta (az a sebesség , amellyel az új mutáns kodonok J megjelennek és végül rögzülnek a populációban)

2.1

itt a (generációnként) I – től J-ig terjedő semleges mutációs ráta, SIJ,k = FJ,k-FI,k pedig a J és FJ kodon javára történő szelekciós együttható,k = 2nfj,k a skálázott malthusi alkalmasság nak, – nek J. a természetes szelekció befolyásolja a relatív helyettesítési arányt. Ha a mutáció előnyös (SIJ,k > 0), akkor a szubsztitúciós arány magasabb,mint a semleges arány (qIJ, k > XXIII), de ha a mutáció káros (SIJ, k < 0), akkor a szubsztitúciós arány csökken (qij, k <). Itt feltételezzük, hogy a szinonim szubsztitúciók semlegesek (SIJ,k = 0), így a K helyszínen az evolúciót 20 aminosav-illesztés határozza meg. A DNA-szubsztitúciós modellekből (például, ha I = TTT és J = TTC, akkor

Inline Formula a HKY szubsztitúciós modell alatt, lásd a részleteket).

egyenlet (2.1) a kodon szubsztitúciót a populációkban folyamatos idejű Markov-folyamatként írja le. Ez akkor ésszerű, ha a generációnkénti mutációs arány kicsi a populáció méretéhez képest ( Inline Formula ), így a populációban kevés a polimorfizmus, és legfeljebb két allél különül el egy helyen egy időben. Az idő aránya, nI,k, hogy a hely k tölti fix I (azaz a helyhez kötött frekvencia I) van

, ahol Inline Formula a frekvencia egy semlegesen fejlődő szekvencia (azaz pszeudo-gén). Így a helyettesítési Arány k-nál, az idő múlásával átlagolva,

ahol az összeg az összes kodonpár felett van I. J. ez az arány felosztható a nem szinonim és szinonim komponens arányokra, pk = pN, k + pS,k,ahol

és ahol az indikátor függvény = 1, ha a helyettesítés nem szinonim, és = 0, ha más. Vegye figyelembe,hogy a szinonim Arány pS, k helyenként változik (például ha egy helyet konzerválnak a metionin számára, akkor a szinonim Arány nulla). Egy semlegesen fejlődő szekvencia esetében az arányokat a

vegye figyelembe, hogy a (2.1) egyenlet megadja a pillanatnyi helyettesítési sebességet, vagyis a K helyszínen kondicionált sebességet, amelyet jelenleg i-re rögzítenek. Másrészt a pk az egyensúlyi sebesség, az összes kodonra átlagolva, helyhez kötött frekvenciájukkal súlyozva.

a relatív nem szinonim helyettesítési Arány

az abszolút nem szinonim A szinonim helyettesítési arány aránya a k helyen pN,k/pS,k. Mivel azonban a szinonim arányok webhelyenként változnak, normalizálnunk kell az arányt a webhely szinonim arányával, Inline Formula , majd normalizálni kell (hogy korrigálja a A szinonim és nem szinonim helyettesítések különböző arányai a semlegességnél). Ez a következő meghatározáshoz vezet:

3.1

Alternatív megoldásként meghatározhatjuk a wk-t a relatív nem szinonim sebességként wk = cpN,k ahol állandó c úgy van beállítva, hogy az arány egy legyen a semlegesen fejlődő szekvenciák esetében, vagyis a kényszer alatt Inline képlet . A nyilvánvaló megoldás a Inline Formula , amely a fenti definícióhoz vezet. Vegye figyelembe, hogy a c kívánatos tulajdonsága, hogy állandó a webhelyeken. Az olvasónak nem szabad meglepődnie, hogy a szinonim Arány kiesik a (3.1) egyenletből. Statisztikai következtetés során a szinonim szubsztitúciók információkat tartalmaznak a semleges mutációs arányokról, így tájékoztatják a Inline Formula értékét. Hasonlóképpen, a relatív szinonim arány a K helyen

3.2

az 1a ábra példát mutat a virágos növények rbcL génjére. A fitnesz értékeket a Halpern–Bruno modell alapján becsülték meg Tamuri et al. , és az értékeiket használjuk a wk és yk kiszámításához itt. A helyek átlagos aránya

Inline Formula és. Vegye figyelembe, hogy sok helyen a szinonim arányok gyorsabbak, mint egy semlegesen fejlődő szekvencia esetében (azaz yk > 1). Ennek oka a genetikai kód furcsa jellege a mutációs torzításokkal párosulva (

1.ábra. — 1. ábra. A relatív nem szinonim (wk) és szinonim (YK) helyettesítési arányok. a) az egyszikűek (virágos növények) rbcl kloroplaszt génjének aránya. (b) az influenza A. in (a,b) PB2 génjének arányát, az egyes helyek alkalmasságát (FIJ,k) és a mutációs paramétereket () A Halpern–Bruno modell szerint megbecsülték a büntetési valószínűség alapján (büntetés). Ezután a (3.1) és (3.2) egyenleteket használjuk a wk és yk kiszámításához. A b) pontban 25 adaptív helyet (vörös) azonosítottak, ahol az alkalmasság különbözik az emberben kialakuló vírusok és a madár (a természetes víztározó) gazdaszervezetek között . Ezeknek a helyeknek az egyes házigazdák alatt való alkalmasságát büntetés nélkül becsülték meg. Ezután a (4.1) egyenletet használjuk a kiszámításához a gazdagép eltolásakor. A tartománya 0,231–7,64 (a legnagyobb értékeket az ábra csonkolja).

1. ábra. A relatív nem szinonim (wk) és szinonim (YK) helyettesítési arányok. a) az egyszikűek (virágos növények) rbcl kloroplaszt génjének aránya. (b) az influenza A. in (a,b) PB2 génjének arányát, az egyes helyek alkalmasságát (FIJ,k) és a mutációs paramétereket () A Halpern–Bruno modell szerint megbecsülték a büntetési valószínűség alapján (büntetés). Ezután a (3.1) és (3.2) egyenleteket használjuk a wk és yk kiszámításához. A b) pontban 25 adaptív helyet (vörös) azonosítottak, ahol az alkalmasság különbözik az emberben kialakuló vírusok és a madár (a természetes víztározó) gazdaszervezetek között . Ezeknek a helyeknek az egyes házigazdák alatt való alkalmasságát büntetés nélkül becsülték meg. Ezután a (4.1) egyenletet használjuk a kiszámításához a gazdagép eltolásakor. A tartománya 0,231–7,64 (a legnagyobb értékeket az ábra csonkolja).

a nem szinonim arány az adaptív evolúció során

amikor az aminosavak illeszkedése állandó az időben, a helyek az optimális aminosavhoz rögzített idő nagy részét töltik. Időnként a szuboptimális aminosavak rögzíthetők, majd rövid evolúciós idő után helyettesíthetők. Ez azt jelenti, hogy a nem szinonim arány a helyszíneken csökken a semlegesen fejlődő szekvenciák arányához képest (azaz wk < 1). Ha azonban a helyek alkalmassága idővel változik (például környezeti eltolás után vagy intenzív frekvenciafüggő kiválasztás alatt), a nem szinonim sebesség felgyorsulhat a semlegesen fejlődő szekvenciák sebességéhez képest (wk > 1). Most azt az esetet tanulmányozzuk, amikor az alkalmasság megváltozik, mint egy új környezethez való alkalmazkodás.

Vegyünk egy K helyet, ahol az I alkalmassága Inline Formula az a környezetben. A helyhez kötött frekvenciák és a pillanatnyi helyettesítési arányok . Most képzeljük el, hogy a környezet eltolódik (például egy hirtelen hidegebb éghajlaton élő emlősök populációja, vagy egy új gazdaszervezetet kolonizáló vírus, ahol az új gazdaszervezet intracelluláris környezete eltér a tározó gazdaszervezetétől). Az I alkalmassága az új környezetben B most Inline Formula . Annak a valószínűsége, hogy a hely jelenleg rögzített i-re a környezeti váltás pillanatában , de a helyettesítési arány most az új környezeté . Így a várható abszolút és relatív nem szinonim arányok a környezeti eltolódásnál

4.1

Ha a fitnesz értékek eltolódása nagy, akkor az arány sokkal felgyorsul ( Inline Formula ). Ez azért történik, mert a hely valószínűleg egy szuboptimális aminosavhoz kötődik az új környezetben, és az optimális aminosavak új mutációi gyorsan rögzülnek. Ha azonban a fitnesz eltolódás mérsékelt, akkor az arány továbbra is alacsonyabb lehet, mint a semleges arány ( Inline Formula ).

az 1b.ábra példát mutat az influenzavírus pb2 génjére. A fitnesz értékeket a Halpern–Bruno modell alapján becsülték meg Tamuri et al. . Tamuri et al.25 adaptív hely egy részhalmazát azonosította (ahol az emberi és a madár gazdaszervezetekben kialakuló vírusok alkalmassága eltérő). , és alkalmasságukat Tamuri et al. . A becsléseket használjuk a wk, yk és Inline képlet itt. Az emberi influenza klasszikus származása valószínűleg a gazdaszervezet madárról emlőstározóra való áttéréséből származott a huszadik század elején . We calculate Inline Formula at the putative host shift. The average rate at adaptive sites is (across all sites and ). Note that for 16 sites for which fitnesses are different between hosts, we find that . Ez azt jelzi, hogy a WK > 1 kritérium az adaptív evolúció kimutatására ebben az esetben konzervatív.

annak a valószínűsége, hogy a hely rögzített I, idő t után a környezet shift

4.2

ahol Inline képlet az átmenet a standard Markov-elmélettel kapott valószínűségek, azaz a inline formula kiszámításával. Így az abszolút és relatív nem szinonim arányok, az eltolás utáni t idő

a (4.2) egyenlet átmeneti valószínűségei az idő exponenciális bomlási függvényei, így Inline Formula szintén exponenciális bomlás. Kezdetben aértéke magas lesz, és ahogy az idő a végtelenségig tart,megközelíti a (3.1) egyenlet által megadott álló értéket. Más szavakkal, nem sokkal a környezetváltás után adaptív szubsztitúciók robbanása következik be azokon a helyeken, ahol az illesztések megváltoztak, és a szubsztitúciók addig halmozódnak fel, amíg a fehérjét kódoló gén el nem éri az adaptív egyensúly állapotát. Például a 2A. ábra a Inline Formula bomlását mutatja a PB2 gén 25 adaptív helyére gazdaeltolódás után.

2.ábra. — 2. ábra. (a) A relatív nem szinonim Arány bomlása a gazdaszervezet eltolódása után 25 adaptív hely (szürke vonalak) az influenza pb2 génjében. A folytonos vonal a 25 oldal átlaga, . Az idő múlásával megközelíti a hosszú távú átlagot (szaggatott vonal). B) a relatív nem szinonim arány a helyszínek átlagos szelekciós együtthatójának függvényében. Rózsaszín pontok: a 10 000 helyre vonatkozó alkalmassági értékeket a normál eloszlásból, az átlagos 0-val és a 0,…, 10-gyel mintavételezték. Ezután a (3.1) és (5.1) egyenleteket használtuk a wk kiszámításához és . Szürke pontok: egy másik 10 000 alkalmassági értékből álló készletet vettünk fel a fentiek szerint, majd a (4.2) és (5.1) egyenleteket használtuk a és a környezeti váltási modell alatt. Folytonos vonal: S/(1−exp (- S)).

2. ábra. (a) A relatív nem szinonim Arány bomlása a gazdaszervezet eltolódása után 25 adaptív hely (szürke vonalak) az influenza pb2 génjében. A folytonos vonal a 25 oldal átlaga, . Az idő múlásával megközelíti a hosszú távú átlagot (szaggatott vonal). B) a relatív nem szinonim arány a helyszínek átlagos szelekciós együtthatójának függvényében. Rózsaszín pontok: a 10 000 helyre vonatkozó alkalmassági értékeket a normál eloszlásból, az átlagos 0-val és a 0,…, 10-gyel mintavételezték. Ezután a (3.1) és (5.1) egyenleteket használtuk a wk kiszámításához és . Szürke pontok: egy másik 10 000 alkalmassági értékből álló készletet vettünk fel a fentiek szerint, majd a (4.2) és (5.1) egyenleteket használtuk a és a környezeti váltási modell alatt. Folytonos vonal: S/(1−exp (- S)).

következtetés

a korábbi szerzők kimutatták , hogy a nem szinonim arány és a szelekciós együttható közötti kapcsolat hozzávetőlegesen a(1-exp (−S)), de a közelítés vagy a végtelen helyek modelljére támaszkodik, vagy feltételezi, hogy minden mutáns aminosav azonos alkalmassággal rendelkezik. A (3.1) és (4.1) egyenletek reálisabb közelítéseket nyújtanak, de nehezen vizualizálhatók. Fontolja meg az I számára rögzített webhelyet. Annak a valószínűsége, hogy a következő mutáció J lesz, Inline Formula az I-hez a J. idővel az I-J mutációk aránya a helyszínen nI, kPIJ lesz. Így az átlagos szelekciós együttható a mutációkon a k helyen

5.1

A 2b ábra a wk-t mutatja a Inline képlet szimulált helyek esetén állandóak, vagy amikor a környezettel együtt mozognak. Vegye figyelembe, hogy a közelítés kb = s/(1 − exp(−S)) ésszerű alsó határt biztosít a wk-ra. Általában Inline Formula , de a kapcsolat nem olyan egyszerű, mint az előző közelítésekben .

a helyszín szerinti mutáció-szelekciós modellben először a szelekciós együtthatókat számítjuk ki, így a WK kiszámítása nélkül tudhatjuk, hogy egy hely pozitív szelekció alatt volt–e . A modell azonban túlparametrizált, számítási szempontból drága, és az illesztéseket csak nagy adatkészletekben lehet jól megbecsülni . Ehelyett a modellnek előnyösnek kell lennie az evolúciós érvelésben és a modellépítésben. Például a WK viselkedése összetettebb modellek alatt (például frekvenciafüggő szelekció , alkalmazkodás a fokozatos környezeti változásokhoz vagy szelekció a kodonhasználaton ) szintén tanulmányozható a hely szerinti mutáció-szelekciós keretrendszer alatt. Ez értékes erőfeszítés lesz, mivel rávilágít arra, hogy képesek vagyunk kimutatni az adaptív evolúciót a molekuláris szekvenciákban.

az adatok hozzáférhetősége

az ehhez a vizsgálathoz kapcsolódó adatok a Dryad doi:10.5061/dryad címen érhetők el.3r3q4.

köszönetnyilvánítások

köszönöm Ziheng Yang, Richard Goldstein és Asif Tamuri értékes megjegyzéseket.

finanszírozási nyilatkozat

Az M. d. R. – t a BBSRC (UK) támogatás támogatja. BB / J009709 / 1 elnyerte Ziheng Yang.

összeférhetetlenség

nincsenek versengő érdekeim.

lábjegyzetek

2015 a szerző(K) megjelent a Royal Society. Minden jog fenntartva.

1
Halpern AL& Bruno WJ. 1998evolúciós távolságok a fehérjekódoló szekvenciák számára: helyspecifikus maradékfrekvenciák modellezése. Mol. Biol. Evol. 15, 910–917. (doi: 10.1093 / oxfordjournals.molbev.a025995). Crossref, PubMed, Isi, Google Scholar
2
Fisher R. 1930a természetes szelekció genetikai elmélete. Oxford, Egyesült Királyság: Clarendon Press. Google Scholar
3
Wright S. 1931evolution Mendeli populációkban. Genetika 16, 97-159. PubMed, Google Scholar
4
Holder MT, Zwickl DJ & Dessimoz C. 2008a filogenetikai módszerek robusztusságának értékelése a helyettesítési folyamatok helyszíni változékonysága szempontjából. Phil. Trans. R. Soc. B 363, 4013-4021. (doi: 10.1098 / rstb.2008.0162). Link, Isi, Google Scholar
5
Spielman SJ & Wilke CO. 2015a dN/dS és a skálázott kiválasztási együtthatók közötti kapcsolat. Mol. Biol. Evol. 32. (doi: 10.1093/molbev / msv003). Crossref, PubMed, Isi, Google Scholar
6
Yang Z& Nielsen R. 2008mutation–selection modellek kodon szubsztitúció és azok használata becslésére szelektív erőssége kodon használat. Mol. Biol. Evol. 25, 568–579. (doi: 10.1093/molbev / msm284). Crossref, PubMed, ISI, Google Scholar
7
Rodrigue N, Philippe H & Lartillot N. 2010mutáció–kiválasztási modellek kódoló szekvencia evolúció hely-heterogén aminosav fitness profilok. Proc. Natl Acad. Sci. USA 107, 4629-4634. (doi: 10.1073 / pnas.0910915107). Crossref, PubMed, Isi, Google Scholar
8
Tamuri AU, dos Reis M & Goldstein RA. 2012A szelekciós együtthatók eloszlásának becslése filogenetikai adatokból sitewise mutáció-szelekciós modellek segítségével. Genetika 190, 1101-1115. (doi: 10.1534 / genetika.111.136432). Crossref, PubMed, ISI, Google Scholar
9
Tamuri AU, Goldman n & dos Reis M. 2014a büntetett-valószínűségi módszer a szelekciós együtthatók eloszlásának becslésére filogenetikai adatokból. Genetika 197, 257-271. (doi: 10.1534 / genetika.114.162263). Crossref, PubMed, Isi, Google Scholar
10
dos Reis M. 2013az adaptív evolúció populációs genetikája és szubsztitúciós modelljei. (http://arxiv.org/abs/1311.6682). Google Scholar
11
Tamuri AU, dos Reis M, Hay aj& Goldstein RA. 2009 a szelektív korlátok változásainak azonosítása: a gazdaszervezetek eltolódása az influenzában. PLoS Comput. Biol. 5, e1000564. (doi: 10.1371 / folyóirat.pcbi.1000564). Crossref, PubMed, Isi, Google Scholar
12
dos Reis M, Hay aj& Goldstein RA. 2009 a nukleotid szubsztitúció nem homogén modelljeinek alkalmazása a gazdaszervezet-eltolódási események azonosítására: alkalmazás az 1918-as spanyol influenzajárvány vírus eredetére. J. Mol. Evol. 69, 333–345. (doi:10.1007 / s00239-009-9282-x). Crossref, PubMed, Isi, Google Scholar
13
Nielsen r& Yang Z. 2003becsüli a szelekciós együtthatók eloszlását a filogenetikai adatokból a mitokondriális és vírusos DNS-hez való alkalmazásokkal. Mol. Biol. Evol. 20, 1231–1239. (doi: 10.1093/molbev / msg147). Crossref, PubMed, Isi, Google Scholar
14
Bustamante CD. 2005a molekuláris evolúció populációs genetikája. Statisztikai módszerek a molekuláris evolúcióban (ed. & Nielsen R), 63-99. New York, új: Springer. Crossref, Google Scholar

hogyan lehet kiszámítani a fehérje-kódoló gének nem szinonim-szinonim arányarányát a Fisher–Wright mutáció–szelekciós keret alatt

Bevezetés

A helyszín szerinti mutáció-szelekciós modell

a relatív nem szinonim helyettesítési Arány

a nem szinonim arány az adaptív evolúció során

következtetés

az adatok hozzáférhetősége

köszönetnyilvánítások

finanszírozási nyilatkozat

összeférhetetlenség

lábjegyzetek

Vélemény, hozzászólás? Kilépés a válaszból

Bevezetés

A helyszín szerinti mutáció-szelekciós modell

a relatív nem szinonim helyettesítési Arány

a nem szinonim arány az adaptív evolúció során

következtetés

az adatok hozzáférhetősége

köszönetnyilvánítások

finanszírozási nyilatkozat

összeférhetetlenség

lábjegyzetek

Vélemény, hozzászólás? Kilépés a válaszból

You may like this....