Johdanto
Halpern & Bruno laati mallin tutkia proteiinia koodaavien geenien divergenssiä perustuen Fisher-Wrightin mutaatiomalliin, valinta ja satunnainen geneettinen ajautuminen . Mallissa jokaiselle tietylle geenin kodonipaikalle osoitetaan omat aminohappo-fitnessiteettinsä, minkä jälkeen Fisher–Wright-mallin avulla saadaan selville kohteen evoluutionopeus. Malli on viime vuosina noussut uudelleen pinnalle, ja sen muunnelmia on käytetty muun muassa fylogeneettisten päättelymenetelmien suorituskyvyn tutkimiseen, kodonin käytön tutkimiseen ja valintakertoimien jakautumisen arvioimiseen proteiinia koodaavissa geeneissä . Ehkä yllättäen mallia ei ole käytetty tutkittaessa proteiinia koodaavien geenien ei-synonyymisen ja synonyymisen nopeussuhteen (tunnetaan myös nimellä ω = dN/dS) dynamiikkaa ja sen merkitystä adaptiivisen molekyylievoluution tutkimuksessa.
tämän huomautuksen tarkoituksena on ehdottaa tapaa määritellä ja laskea vastaava klassisen käsitteen”ei-synonyymi–synonyymi-suhdeluku”yhteydessä Halpernin mutaatiovalintamalliin & Bruno . On toivottavaa, että käyttämällä populaatiogenetiikan ensimmäisiä periaatteita voimme saada ilmentymän ω proteiinia koodaavan geenin kodonipaikoissa vaikuttavien valintakertoimien funktiona. Tämän pitäisi antaa paljon tietoa kodonipaikkojen evoluutiodynamiikasta, ja siitä pitäisi olla hyötyä rakennettaessa tilastollisia malleja, joilla voidaan havaita Adaptiivinen evoluutio proteiinia koodaavissa geeneissä.
paikkaviisas mutaatiovalintamalli
tarkastelee kodonipaikan k kehittymistä proteiinia koodaavassa geenissä populaatiossa, jolla on n haploidisia genomeja. Oletetaan, että sivusto on tällä hetkellä kiinteä kodonille I (eli kaikki N-alleelit kantavat I: tä kohteessa k). Mutaatioiden valintakehyksessä substituutioaste (nopeus , jolla uudet mutanttikodonit J ilmaantuvat ja lopulta vakiintuvat populaatiossa) on
tässä µIJ on neutraali mutaationopeus (sukupolvea kohti) I: stä J: hen, ja SIJ,k = FJ,k–FI,k on valintakerroin kodonin J ja FJ,k: n hyväksi = 2nfj,k on skaalattu malthusialainen J. luonnonvalinta vaikuttaa suhteelliseen substituutioasteeseen. Kun mutaatio on edullinen (SIJ,k > 0), substituutioaste on neutraalia korkeampi (qIJ,k > µIJ), mutta jos mutaatio on haitallinen (SIJ,k < 0), substituutioaste pienenee (qij,k < µij). Tässä oletamme,että synonyymit substituutiot ovat neutraaleja (SIJ, k = 0), ja siten evoluutio paikassa k määräytyy 20 aminohapon fitnessiteetin perusteella. ΜIJ voidaan konstruoida tavallisista DNA-substituutiomalleista (esimerkiksi jos i = TTT ja J = TTC, niin
HKY-substituutiomallissa, KS.tarkemmat tiedot).
yhtälö (2.1) kuvaa kodonisubstituutiota populaatioissa jatkuvan ajan Markov-prosessina. Tämä on järkevää, jos sukupolvikohtainen mutaationopeus on pieni verrattuna populaation kokoon (), jolloin populaatiossa on vain vähän polymorfiaa ja korkeintaan kaksi alleelia eriytyy yhteen kohtaan kerrallaan. Se osuus ajasta, nI,k, jonka paikka k viettää kiinteänä I: lle (eli stationääritaajuus I: lle) on
, missäon neutraalisti kehittyvän sekvenssin taajuus (eli pseudogeeni). Näin ollen korvausaste K: ssa ajan keskiarvona on
missä summa on kaikilla kodonipareilla i ≠ J. Tämä korko voidaan jakaa ei-synonyymeihin ja synonyymeihin komponenttinopeuksiin, pk = pN, k + pS, K, Missä
ja missä indikaattori funktio on = 1,jos substituutio ei ole synonyymi,ja = 0, jos toisin on. Huomaa,että synonyyminopeus pS, k vaihtelee kohteiden välillä (esimerkiksi, jos sivusto on säilytetty metioniinille, niin synonyyminopeus on nolla). Neutraalisti kehittyvälle jaksolle nopeudet saadaan kaavalla
huomaa, että yhtälö (2.1) antaa hetkellisen substituutionopeuden, eli paikalla k ehdollistunut nopeus on tällä hetkellä kiinteä I: lle. Toisaalta pk on tasapainonopeus, joka lasketaan kaikkien kodonien keskiarvona ja painotetaan niiden stationaarisilla taajuuksilla.
suhteellinen ei-synonyymi substituutioaste
absoluuttinen ei-synonyymi-substituutioaste kohteessa k on PN,k / pS,k. Koska synonyymisuhteet kuitenkin vaihtelevat eri kohteissa, on suhdeluku normalisoitava sivuston synonyymisuhteella,
vaihtoehtoisesti voimme määritellä WK: n suhteelliseksi ei-synonyymiseksi nopeudeksi wk = cpN, K Missä vakio c on asetettu siten,että suhde on yksi neutraalisti kehittyville sekvensseille, eli rajoituksen . Ilmeinen ratkaisu on johtaen samaan määritelmään kuin edellä. Huomaa, että c on toivottavaa ominaisuus on vakio yli sivustoja. Lukijan ei pitäisi yllättyä siitä, että synonyyminopeus putoaa pois yhtälöstä (3,1). Tilastollista päättelyä tehtäessä synonyymeillä substituutioilla on tietoa neutraaleista mutaationopeuksista, ja siten ne ilmoittavat arvon . Vastaavasti suhteellinen synonyyminopeus kohdassa k on
Kuva 1a esittää esimerkin kukkivien kasvien rbcL-geenistä. Kuntoarvot arvioitiin Halvern-Bruno-mallin mukaan tamuri et al. , ja käytämme heidän arvojaan WK: n ja yk: n laskemiseen täällä. Alueiden keskinopeudet ovat1). Tämä johtuu geneettisen koodin omituisuudesta yhdistettynä mutaatioharhoihin (
ei-synonyymi adaptiivisen evoluution aikana
kun aminohappojen fitnessiteetti on vakio läpi ajan, paikat viettävät suurimman osan ajasta optimaaliselle aminohapolle kiinteänä. Joskus suboptimaaliset aminohapot voivat muuttua kiinteiksi ja sitten korvautua lyhyen evolutiivisen ajan kuluttua. Tämä tarkoittaa, että ei-synonyyminen nopeus kohteissa pienenee verrattuna neutraalisti kehittyvien sekvenssien nopeuteen (eli wk < 1). Jos kuitenkin sopivuus kohteissa vaihtelee ajan mittaan (esimerkiksi ympäristönsiirron jälkeen tai voimakkaassa taajuusriippuvaisessa valinnassa ), ei-synonyyminen nopeus voi nopeutua verrattuna neutraalisti kehittyvien sekvenssien nopeuteen (wk > 1). Tutkimme nyt tapausta, jossa fitnessmallit muuttuvat sopeutumana uudenlaiseen ympäristöön.
tarkastellaan paikkaa k, jossa I: n kunto on ympäristössä A. Stationaariset taajuudet ja hetkelliset korvausasteet ovat . Kuvitelkaa, että ympäristö muuttuu (esimerkiksi yhtäkkiä kylmemmässä ilmastossa elävä nisäkäspopulaatio tai uutta isäntää asuttava virus, jossa uuden isännän solunsisäinen ympäristö on erilainen kuin säiliöisäntä). I: n kelpoisuus uudessa ympäristössä B on nyt . Todennäköisyys sille, että paikka on tällä hetkellä kiinteä I: lle ympäristön muutoshetkellä, on
Jos muutos kuntoarvoissa on suuri, vauhti kiihtyy huomattavasti (). Tämä johtuu siitä, että sivusto todennäköisesti löytää itsensä kiinteä suboptimaalinen aminohappo uudessa ympäristössä, ja uusia mutaatioita optimaalinen aminohappoja tulee kiinteä nopeasti. Jos kuntovuoro on kuitenkin kohtalainen, nopeus voi silti olla pienempi kuin neutraali ().
Kuvassa 1b on esimerkki influenssaviruksen PB2-geenistä. Kuntoarvot arvioitiin Halvern-Bruno-mallin mukaan tamuri et al. . Tamuri ym.yksilöivät 25 adaptiivisen kohdan alajoukon (jossa sopivuus on erilainen ihmisen ja linnun isännissä kehittyville viruksille). , ja niiden sopivuus arvioitu Tamuri et al. . Arvioilla lasketaan WK, yk ja täällä. Ihmisen influenssan klassinen perimä sai todennäköisesti alkunsa isännän siirtymisestä linnusta nisäkäsvarastoon 1900-luvun alussa . We calculate at the putative host shift. The average rate at adaptive sites is (across all sites and ). Note that for 16 sites for which fitnesses are different between hosts, we find that . Tämä osoittaa, että kriteeri WK > 1 adaptiivisen evoluution havaitsemiseksi on tässä tapauksessa konservatiivinen.
todennäköisyys sille, että paikka on kiinteä i, aika t ympäristön muutoksen jälkeen on
missäovat siirtymät todennäköisyydet, jotka saadaan käyttämällä Markovin Standarditeoriaa eli laskemalla
yhtälön (4.2) siirtymätodennäköisyydet ovat ajan eksponentiaalisia hajoamisfunktioita, jotenon myös eksponentiaalinen hajoaminen. AluksiPB2-geenin 25 adaptiivisen kohdan hajoaminen isäntäsiirron jälkeen.
johtopäätös
aiemmat kirjoittajat ovat osoittaneet , että ei-synonyymisen nopeuden ja valintakertoimen suhde on suunnilleen ω = S / (1 − exp(−s)), mutta likiarvo perustuu joko äärettömien paikkojen malliin tai olettaa, että kaikilla mutanttiaminohapoilla on sama kelpoisuus. Yhtälöt (3.1) ja (4.1) antavat realistisempia likiarvoja, mutta niitä on vaikea hahmottaa. Harkitse I: lle määrättyä paikkaa. Todennäköisyys sille, että seuraava mutaatio on J,on I ≠ J. ajan myötä I-J-mutaatioiden osuus kohdassa on nI, kPIJ. Näin ollen mutaatioiden keskimääräinen valintakerroin kohdassa k on
Kuva 2b osoittaa wk: n funktionasimuloiduille alueille, kun sopivuus on vakio tai kun se muuttuu ympäristön mukana. Huomaa, että approksimaatio ω = S/(1 − exp(−s)) antaa kohtuullisen alarajan wk: lle. Yleensä” class=”alignright”>, mutta suhde ei ole yhtä yksinkertainen kuin aiemmissa likiarvoissa .
paikkaviisaassa mutaatiovalintamallissa lasketaan ensin valintakertoimet, ja näin voidaan tietää, onko jokin paikka ollut positiivisen valinnan kohteena wk: ta laskematta . Malli on kuitenkin yliparametrisoitu, laskennallisesti kallis, ja fitnessejä voidaan hyvin arvioida vain suurissa tietokokonaisuuksissa . Sen sijaan mallista pitäisi olla hyötyä evolutiivisessa päättelyssä ja mallirakentamisessa. Esimerkiksi WK: n käyttäytymistä monimutkaisemmissa malleissa (kuten taajuusriippuvainen valinta , sopeutuminen asteittaisiin ympäristön muutoksiin tai kodonin käyttöön perustuva valinta ) voidaan tutkia myös paikkaviisaan mutaatiovalintaan perustuvassa viitekehyksessä. Tämä on vaivan arvoista, sillä se valottaa kykyämme havaita Adaptiivinen evoluutio molekyylisekvensseissä.
tietojen saatavuus
tähän tutkimukseen liittyvät tiedot ovat saatavilla osoitteesta Dryad doi:10.5061 / dryad.3r3q4.
kiitokset
kiitän ziheng Yangia, Richard Goldsteinia ja Asif Tamuria arvokkaista kommenteista.
rahoituslaskelma
M. d.R: ää tukee BBSRC (UK) grant no. BB / J009709 / 1 myönnetty Ziheng Yangille.
eturistiriidat
minulla ei ole kilpailevia intressejä.
alaviitteet
- 1
Halpern AL& Bruno WJ. 1998 devolutive distances for protein-coding sequences: modeling site-specific residue frequencies. Mol. Biol. Evol. 15, 910–917. (doi:10.1093/oxfordjournals.molbev.a025995). Crossref, PubMed, ISI, Google Scholar
- 2
Fisher R. 1930 the genetic theory of natural selection. Oxford, Iso-Britannia: Clarendon Press. Google Scholar
- 3
Wright S. 1931Evolution in Mendelin populations. Genetics 16, 97-159. PubMed, Google Scholar
- 4
Holder MT, Zwickl DJ& dessimoz C. 2008evaluating the robustness of fylogenetic methods to among-site variability in substitution processes. Phil. Trans. R. Soc. B 363, 4013-4021. (doi:10.1098/rstb.2008.0162). Link, ISI, Google Scholar
- 5
Spielman SJ& Wilke CO. 2015dn/dS: n ja skaalattujen valintakertoimien välinen suhde. Mol. Biol. Evol. 32. (doi: 10.1093 / molbev / msv003). Crossref, PubMed, ISI, Google Scholar
- 6
Yang Z& Nielsen R. 2008mutation–select models of codon substitution and their use to estimate selective strengths on codon usage. Mol. Biol. Evol. 25, 568–579. (doi: 10.1093 / molbev / msm284). Crossref, PubMed, ISI, Google Scholar
- 7
Rodrigue N, Philippe h& Lartillot N. 2010mutation–selection models of coding sequence evolution with site-heterogeneous aminohappo fitness profiles. Proc. Natl Acad. Sci. USA 107, 4629-4634. (doi: 10.1073 / pnas.0910915107). Crossref, PubMed, ISI, Google Scholar
- 8
Tamuri AU, dos Reis m& Goldstein RA. 2012 arvioidaan valintakertoimien jakautumista fylogeneettisistä tiedoista sitewise-mutaatiovalintamallien avulla. Genetics 190, 1101-1115. (doi:10.1534/genetiikka.111.136432). Crossref, PubMed, ISI, Google Scholar
- 9
Tamuri AU, Goldman n& dos Reis M. 2014a penalized-likability method to estimate the distribution of selection coefficient from fylogenetic data. Genetics 197, 257-271. (doi:10.1534/genetiikka.114.162263). Crossref, PubMed, ISI, Google Scholar
- 10
dos Reis M. 2013population genetics and substitution models of adaptive evolution. (http://arxiv.org/abs/1311.6682). Google Scholar
- 11
Tamuri AU, dos Reis M, Hay AJ& Goldstein RA. 2009muutoksia valikoivissa rajoitteissa: influenssan isäntävuorot. PLoS Comput. Biol. 5, e1000564. (doi: 10.1371 / lehti.pcbi.1000564). Crossref, PubMed, ISI, Google Scholar
- 12
dos Reis M, Hay AJ& Goldstein RA. 2009 nukleotidisubstituution epähomogeenisten mallien käyttö isäntävuorotapahtumien tunnistamiseksi: soveltaminen vuoden 1918 ”Espanjan” influenssapandemiaviruksen alkuperään. J. Mol. Evol. 69, 333–345. (doi: 10.1007 / s00239-009-9282-x). Crossref, PubMed, ISI, Google Scholar
- 13
Nielsen R& Yang Z. Mol. Biol. Evol. 20, 1231–1239. (doi: 10.1093 / molbev / msg147). Crossref, PubMed, ISI, Google Scholar
- 14
Bustamante CD. 2005population genetics of molecular evolution. Statistical methods in molecular evolution (toim. & Nielsen R), S.63-99. New York, NY: Springer. Crossref, Google Scholar