Miten lasketaan ei-synonyymi–synonyymi–suhde proteiinia koodaaviin geeneihin Fisher-Wright mutaatio–valintakehyksessä

Johdanto

Halpern & Bruno laati mallin tutkia proteiinia koodaavien geenien divergenssiä perustuen Fisher-Wrightin mutaatiomalliin, valinta ja satunnainen geneettinen ajautuminen . Mallissa jokaiselle tietylle geenin kodonipaikalle osoitetaan omat aminohappo-fitnessiteettinsä, minkä jälkeen Fisher–Wright-mallin avulla saadaan selville kohteen evoluutionopeus. Malli on viime vuosina noussut uudelleen pinnalle, ja sen muunnelmia on käytetty muun muassa fylogeneettisten päättelymenetelmien suorituskyvyn tutkimiseen, kodonin käytön tutkimiseen ja valintakertoimien jakautumisen arvioimiseen proteiinia koodaavissa geeneissä . Ehkä yllättäen mallia ei ole käytetty tutkittaessa proteiinia koodaavien geenien ei-synonyymisen ja synonyymisen nopeussuhteen (tunnetaan myös nimellä ω = dN/dS) dynamiikkaa ja sen merkitystä adaptiivisen molekyylievoluution tutkimuksessa.

tämän huomautuksen tarkoituksena on ehdottaa tapaa määritellä ja laskea vastaava klassisen käsitteen”ei-synonyymi–synonyymi-suhdeluku”yhteydessä Halpernin mutaatiovalintamalliin & Bruno . On toivottavaa, että käyttämällä populaatiogenetiikan ensimmäisiä periaatteita voimme saada ilmentymän ω proteiinia koodaavan geenin kodonipaikoissa vaikuttavien valintakertoimien funktiona. Tämän pitäisi antaa paljon tietoa kodonipaikkojen evoluutiodynamiikasta, ja siitä pitäisi olla hyötyä rakennettaessa tilastollisia malleja, joilla voidaan havaita Adaptiivinen evoluutio proteiinia koodaavissa geeneissä.

paikkaviisas mutaatiovalintamalli

tarkastelee kodonipaikan k kehittymistä proteiinia koodaavassa geenissä populaatiossa, jolla on n haploidisia genomeja. Oletetaan, että sivusto on tällä hetkellä kiinteä kodonille I (eli kaikki N-alleelit kantavat I: tä kohteessa k). Mutaatioiden valintakehyksessä substituutioaste (nopeus , jolla uudet mutanttikodonit J ilmaantuvat ja lopulta vakiintuvat populaatiossa) on

Näyttökaava

2,1

tässä µIJ on neutraali mutaationopeus (sukupolvea kohti) I: stä J: hen, ja SIJ,k = FJ,k–FI,k on valintakerroin kodonin J ja FJ,k: n hyväksi = 2nfj,k on skaalattu malthusialainen J. luonnonvalinta vaikuttaa suhteelliseen substituutioasteeseen. Kun mutaatio on edullinen (SIJ,k > 0), substituutioaste on neutraalia korkeampi (qIJ,k > µIJ), mutta jos mutaatio on haitallinen (SIJ,k < 0), substituutioaste pienenee (qij,k < µij). Tässä oletamme,että synonyymit substituutiot ovat neutraaleja (SIJ, k = 0), ja siten evoluutio paikassa k määräytyy 20 aminohapon fitnessiteetin perusteella. ΜIJ voidaan konstruoida tavallisista DNA-substituutiomalleista (esimerkiksi jos i = TTT ja J = TTC, niin

Inline kaavaHKY-substituutiomallissa, KS.tarkemmat tiedot).

yhtälö (2.1) kuvaa kodonisubstituutiota populaatioissa jatkuvan ajan Markov-prosessina. Tämä on järkevää, jos sukupolvikohtainen mutaationopeus on pieni verrattuna populaation kokoon (Inline kaava), jolloin populaatiossa on vain vähän polymorfiaa ja korkeintaan kaksi alleelia eriytyy yhteen kohtaan kerrallaan. Se osuus ajasta, nI,k, jonka paikka k viettää kiinteänä I: lle (eli stationääritaajuus I: lle) on

Näyttökaava

, missäInline-kaavaon neutraalisti kehittyvän sekvenssin taajuus (eli pseudogeeni). Näin ollen korvausaste K: ssa ajan keskiarvona on

Näyttökaava

missä summa on kaikilla kodonipareilla i ≠ J. Tämä korko voidaan jakaa ei-synonyymeihin ja synonyymeihin komponenttinopeuksiin, pk = pN, k + pS, K, Missä

Näyttökaava

ja missä indikaattori funktio on = 1,jos substituutio ei ole synonyymi,ja = 0, jos toisin on. Huomaa,että synonyyminopeus pS, k vaihtelee kohteiden välillä (esimerkiksi, jos sivusto on säilytetty metioniinille, niin synonyyminopeus on nolla). Neutraalisti kehittyvälle jaksolle nopeudet saadaan kaavalla

Näyttökaava

huomaa, että yhtälö (2.1) antaa hetkellisen substituutionopeuden, eli paikalla k ehdollistunut nopeus on tällä hetkellä kiinteä I: lle. Toisaalta pk on tasapainonopeus, joka lasketaan kaikkien kodonien keskiarvona ja painotetaan niiden stationaarisilla taajuuksilla.

suhteellinen ei-synonyymi substituutioaste

absoluuttinen ei-synonyymi-substituutioaste kohteessa k on PN,k / pS,k. Koska synonyymisuhteet kuitenkin vaihtelevat eri kohteissa, on suhdeluku normalisoitava sivuston synonyymisuhteella, Inline Formula_15a>Inline formula_1/Div > (oikea eri mittasuhteet synonyymi ja ei-synonyymit neutraalius). Tästä seuraa seuraava määritelmä:

Näyttökaava

3.1

vaihtoehtoisesti voimme määritellä WK: n suhteelliseksi ei-synonyymiseksi nopeudeksi wk = cpN, K Missä vakio c on asetettu siten,että suhde on yksi neutraalisti kehittyville sekvensseille, eli rajoituksen Inline kaava. Ilmeinen ratkaisu on Inline kaava johtaen samaan määritelmään kuin edellä. Huomaa, että c on toivottavaa ominaisuus on vakio yli sivustoja. Lukijan ei pitäisi yllättyä siitä, että synonyyminopeus putoaa pois yhtälöstä (3,1). Tilastollista päättelyä tehtäessä synonyymeillä substituutioilla on tietoa neutraaleista mutaationopeuksista, ja siten ne ilmoittavat arvon Inline kaava. Vastaavasti suhteellinen synonyyminopeus kohdassa k on

Näyttökaava

3,2

Kuva 1a esittää esimerkin kukkivien kasvien rbcL-geenistä. Kuntoarvot arvioitiin Halvern-Bruno-mallin mukaan tamuri et al. , ja käytämme heidän arvojaan WK: n ja yk: n laskemiseen täällä. Alueiden keskinopeudet ovatInline Formula_5/div> jaInline Formula_5/div>. Huomaa, että monissa kohteissa synonyymit ovat nopeampia kuin neutraalisti kehittyvässä sekvenssissä (eli yk1). Tämä johtuu geneettisen koodin omituisuudesta yhdistettynä mutaatioharhoihin (Inline kaava

Kuva 1.

kuva 1. Suhteellinen ei-synonyymi (wk) ja synonyymi (yk) korvausasteet. (a) monokottien (kukkivien kasvien) rbcl-kloroplastigeenin määrät. (B) influenssa A: n PB2–geenin esiintyvyys In (a,b), fitness-arvot kussakin kohdassa (FIJ,k) ja mutaatioparametrit (Inline-kaava) arvioitiin Halvern-Bruno-mallin mukaisesti rangaistustodennäköisyydellä (penalty α = 0, 01) ja ne ovat alk . Tämän jälkeen käytetään yhtälöitä (3.1) ja (3.2) wk: n ja yk: n laskemiseksi. B alakohdassa yksilöitiin 25 adaptiivista kohtaa (punainen), joissa ihmisen ja linnun (luonnollisen säiliön) isännässä kehittyvien virusten sopivuus on erilainen . Fitnesses näiden sivustojen alle kunkin isännän arvioitiin ilman rangaistusta ja ovat alkaen . Tämän jälkeen lasketaan yhtälöllä (4.1) Inline Formula_3/div> isäntävuorossa. VaihteluväliInline kaava on 0,231–7,64 (suurimmat arvot on typistetty kuvassa).

ei-synonyymi adaptiivisen evoluution aikana

kun aminohappojen fitnessiteetti on vakio läpi ajan, paikat viettävät suurimman osan ajasta optimaaliselle aminohapolle kiinteänä. Joskus suboptimaaliset aminohapot voivat muuttua kiinteiksi ja sitten korvautua lyhyen evolutiivisen ajan kuluttua. Tämä tarkoittaa, että ei-synonyyminen nopeus kohteissa pienenee verrattuna neutraalisti kehittyvien sekvenssien nopeuteen (eli wk < 1). Jos kuitenkin sopivuus kohteissa vaihtelee ajan mittaan (esimerkiksi ympäristönsiirron jälkeen tai voimakkaassa taajuusriippuvaisessa valinnassa ), ei-synonyyminen nopeus voi nopeutua verrattuna neutraalisti kehittyvien sekvenssien nopeuteen (wk > 1). Tutkimme nyt tapausta, jossa fitnessmallit muuttuvat sopeutumana uudenlaiseen ympäristöön.

tarkastellaan paikkaa k, jossa I: n kunto on Inline kaava ympäristössä A. Stationaariset taajuudet ja hetkelliset korvausasteet ovat Inline kaava. Kuvitelkaa, että ympäristö muuttuu (esimerkiksi yhtäkkiä kylmemmässä ilmastossa elävä nisäkäspopulaatio tai uutta isäntää asuttava virus, jossa uuden isännän solunsisäinen ympäristö on erilainen kuin säiliöisäntä). I: n kelpoisuus uudessa ympäristössä B on nyt Inline kaava. Todennäköisyys sille, että paikka on tällä hetkellä kiinteä I: lle ympäristön muutoshetkellä, on Inline Formula_5 / div>, mutta korvausaste on nyt uuden ympäristönInline Formula_3 / div>. Näin ollen odotetut absoluuttiset ja suhteelliset ei-synonyymit ympäristön muutoksessa ovat

Näyttökaava

4.1

Jos muutos kuntoarvoissa on suuri, vauhti kiihtyy huomattavasti (Inline kaava). Tämä johtuu siitä, että sivusto todennäköisesti löytää itsensä kiinteä suboptimaalinen aminohappo uudessa ympäristössä, ja uusia mutaatioita optimaalinen aminohappoja tulee kiinteä nopeasti. Jos kuntovuoro on kuitenkin kohtalainen, nopeus voi silti olla pienempi kuin neutraali (Inline kaava).

Kuvassa 1b on esimerkki influenssaviruksen PB2-geenistä. Kuntoarvot arvioitiin Halvern-Bruno-mallin mukaan tamuri et al. . Tamuri ym.yksilöivät 25 adaptiivisen kohdan alajoukon (jossa sopivuus on erilainen ihmisen ja linnun isännissä kehittyville viruksille). , ja niiden sopivuus arvioitu Tamuri et al. . Arvioilla lasketaan WK, yk ja Inline kaava täällä. Ihmisen influenssan klassinen perimä sai todennäköisesti alkunsa isännän siirtymisestä linnusta nisäkäsvarastoon 1900-luvun alussa . We calculate Inline Formula at the putative host shift. The average rate at adaptive sites is Inline Formula (across all sites Inline Formula and Inline Formula). Note that for 16 sites for which fitnesses are different between hosts, we find that Inline Formula. Tämä osoittaa, että kriteeri WK > 1 adaptiivisen evoluution havaitsemiseksi on tässä tapauksessa konservatiivinen.

todennäköisyys sille, että paikka on kiinteä i, aika t ympäristön muutoksen jälkeen on

näytön kaava

4.2

missäInline kaavaovat siirtymät todennäköisyydet, jotka saadaan käyttämällä Markovin Standarditeoriaa eli laskemalla

inline formula_1/div>. Näin ollen absoluuttiset ja suhteelliset ei-synonyymit, aika t muutoksen jälkeen, ovatNäyttökaavayhtälön (4.2) siirtymätodennäköisyydet ovat ajan eksponentiaalisia hajoamisfunktioita, jotenInline-kaavaon myös eksponentiaalinen hajoaminen. AluksiInline formula_1/div> on korkea, ja kun aika menee äärettömään,Inline Formula_3.1. Toisin sanoen, pian ympäristön muutoksen jälkeen, adaptiivisten substituutioiden purkaus tapahtuu paikoissa, joissa fitnessness on muuttunut, ja substituutiot kerääntyvät, kunnes proteiinia koodaava geeni saavuttaa adaptiivisen tasapainon tilan. Esimerkiksi kuvassa 2a näkyyInline kaavaPB2-geenin 25 adaptiivisen kohdan hajoaminen isäntäsiirron jälkeen.

kuva 2.

kuva 2. a) influenssan PB2-geenin 25 adaptiivisen kohdan (harmaiden viivojen) suhteellinen hajoamisnopeus isäntävuoron vaihtumisen jälkeen. Kiinteä viiva on 25 alueen välinen keskiarvo, Inline kaava. Ajan kuluessa Inline Formula_8/div> lähestyy pitkän aikavälin keskiarvoaInline Formula_15a (katkoviiva). B) suhteellinen ei-synonyymi keskimääräisen valintakertoimen funktiona kohteissa. Vaaleanpunaiset pisteet: 10 000 alueen kuntoarvot otettiin normaalijakaumista keskiarvoilla 0 ja σ = 0,..., 10. Tämän jälkeen WK: n laskemiseen käytettiin yhtälöitä (3.1) ja (5.1) jaInline-kaava. Harmaat pisteet: toinen 10 000 kuntoarvon joukko otettiin yllä olevaan tapaan, sitten laskettiin yhtälöillä (4.2) ja (5.1) Inline kaava ja inline kaava alle environment Shift model. Kiinteä linja: S/(1 − exp(−s)).

johtopäätös

aiemmat kirjoittajat ovat osoittaneet , että ei-synonyymisen nopeuden ja valintakertoimen suhde on suunnilleen ω = S / (1 − exp(−s)), mutta likiarvo perustuu joko äärettömien paikkojen malliin tai olettaa, että kaikilla mutanttiaminohapoilla on sama kelpoisuus. Yhtälöt (3.1) ja (4.1) antavat realistisempia likiarvoja, mutta niitä on vaikea hahmottaa. Harkitse I: lle määrättyä paikkaa. Todennäköisyys sille, että seuraava mutaatio on J,on Inline kaava I ≠ J. ajan myötä I-J-mutaatioiden osuus kohdassa on nI, kPIJ. Näin ollen mutaatioiden keskimääräinen valintakerroin kohdassa k on

Näyttökaava

5.1

Kuva 2b osoittaa wk: n funktionaInline-kaavasimuloiduille alueille, kun sopivuus on vakio tai kun se muuttuu ympäristön mukana. Huomaa, että approksimaatio ω = S/(1 − exp(−s)) antaa kohtuullisen alarajan wk: lle. YleensäInline Formula_15a” class=”alignright”>Inline kaava, mutta suhde ei ole yhtä yksinkertainen kuin aiemmissa likiarvoissa .

paikkaviisaassa mutaatiovalintamallissa lasketaan ensin valintakertoimet, ja näin voidaan tietää, onko jokin paikka ollut positiivisen valinnan kohteena wk: ta laskematta . Malli on kuitenkin yliparametrisoitu, laskennallisesti kallis, ja fitnessejä voidaan hyvin arvioida vain suurissa tietokokonaisuuksissa . Sen sijaan mallista pitäisi olla hyötyä evolutiivisessa päättelyssä ja mallirakentamisessa. Esimerkiksi WK: n käyttäytymistä monimutkaisemmissa malleissa (kuten taajuusriippuvainen valinta , sopeutuminen asteittaisiin ympäristön muutoksiin tai kodonin käyttöön perustuva valinta ) voidaan tutkia myös paikkaviisaan mutaatiovalintaan perustuvassa viitekehyksessä. Tämä on vaivan arvoista, sillä se valottaa kykyämme havaita Adaptiivinen evoluutio molekyylisekvensseissä.

tietojen saatavuus

tähän tutkimukseen liittyvät tiedot ovat saatavilla osoitteesta Dryad doi:10.5061 / dryad.3r3q4.

kiitokset

kiitän ziheng Yangia, Richard Goldsteinia ja Asif Tamuria arvokkaista kommenteista.

rahoituslaskelma

M. d.R: ää tukee BBSRC (UK) grant no. BB / J009709 / 1 myönnetty Ziheng Yangille.

eturistiriidat

minulla ei ole kilpailevia intressejä.

alaviitteet

© 2015 the Author(s) Published by the Royal Society. Kaikki oikeudet pidätetään.
  • 1
    Halpern AL& Bruno WJ. 1998 devolutive distances for protein-coding sequences: modeling site-specific residue frequencies. Mol. Biol. Evol. 15, 910–917. (doi:10.1093/oxfordjournals.molbev.a025995). Crossref, PubMed, ISI, Google Scholar
  • 2
    Fisher R. 1930 the genetic theory of natural selection. Oxford, Iso-Britannia: Clarendon Press. Google Scholar
  • 3
    Wright S. 1931Evolution in Mendelin populations. Genetics 16, 97-159. PubMed, Google Scholar
  • 4
    Holder MT, Zwickl DJ& dessimoz C. 2008evaluating the robustness of fylogenetic methods to among-site variability in substitution processes. Phil. Trans. R. Soc. B 363, 4013-4021. (doi:10.1098/rstb.2008.0162). Link, ISI, Google Scholar
  • 5
    Spielman SJ& Wilke CO. 2015dn/dS: n ja skaalattujen valintakertoimien välinen suhde. Mol. Biol. Evol. 32. (doi: 10.1093 / molbev / msv003). Crossref, PubMed, ISI, Google Scholar
  • 6
    Yang Z& Nielsen R. 2008mutation–select models of codon substitution and their use to estimate selective strengths on codon usage. Mol. Biol. Evol. 25, 568–579. (doi: 10.1093 / molbev / msm284). Crossref, PubMed, ISI, Google Scholar
  • 7
    Rodrigue N, Philippe h& Lartillot N. 2010mutation–selection models of coding sequence evolution with site-heterogeneous aminohappo fitness profiles. Proc. Natl Acad. Sci. USA 107, 4629-4634. (doi: 10.1073 / pnas.0910915107). Crossref, PubMed, ISI, Google Scholar
  • 8
    Tamuri AU, dos Reis m& Goldstein RA. 2012 arvioidaan valintakertoimien jakautumista fylogeneettisistä tiedoista sitewise-mutaatiovalintamallien avulla. Genetics 190, 1101-1115. (doi:10.1534/genetiikka.111.136432). Crossref, PubMed, ISI, Google Scholar
  • 9
    Tamuri AU, Goldman n& dos Reis M. 2014a penalized-likability method to estimate the distribution of selection coefficient from fylogenetic data. Genetics 197, 257-271. (doi:10.1534/genetiikka.114.162263). Crossref, PubMed, ISI, Google Scholar
  • 10
    dos Reis M. 2013population genetics and substitution models of adaptive evolution. (http://arxiv.org/abs/1311.6682). Google Scholar
  • 11
    Tamuri AU, dos Reis M, Hay AJ& Goldstein RA. 2009muutoksia valikoivissa rajoitteissa: influenssan isäntävuorot. PLoS Comput. Biol. 5, e1000564. (doi: 10.1371 / lehti.pcbi.1000564). Crossref, PubMed, ISI, Google Scholar
  • 12
    dos Reis M, Hay AJ& Goldstein RA. 2009 nukleotidisubstituution epähomogeenisten mallien käyttö isäntävuorotapahtumien tunnistamiseksi: soveltaminen vuoden 1918 ”Espanjan” influenssapandemiaviruksen alkuperään. J. Mol. Evol. 69, 333–345. (doi: 10.1007 / s00239-009-9282-x). Crossref, PubMed, ISI, Google Scholar
  • 13
    Nielsen R& Yang Z. Mol. Biol. Evol. 20, 1231–1239. (doi: 10.1093 / molbev / msg147). Crossref, PubMed, ISI, Google Scholar
  • 14
    Bustamante CD. 2005population genetics of molecular evolution. Statistical methods in molecular evolution (toim. & Nielsen R), S.63-99. New York, NY: Springer. Crossref, Google Scholar

Vastaa

Sähköpostiosoitettasi ei julkaista.