Introduction
Halpern&Brunoは、Fisher–Wright突然変異、選択および選択のモデルに基づいてタンパク質コード遺伝子の発散を研究するモデルを考案した。ランダムな遺伝的ドリフト。 このモデルでは、遺伝子内の各特定のコドン部位に独自のアミノ酸適合度のセットが割り当てられ、その後、Fisher–Wrightモデルを使用して部位の進化速度を このモデルは近年復活しており、そのバリエーションは、例えば、系統発生推論法の性能を研究し、コドンの使用法を研究し、タンパク質コード遺伝子の選択係数の分布を推定するために使用されている。 おそらく驚くべきことに、このモデルは、タンパク質コード遺伝子の非同義対同義速度比(ω=dN/dSとしても知られている)と適応分子進化の研究におけるその意義のダイナミクスを研究するために使用されていない。
このノートの目的は、Halpern&Brunoの突然変異選択モデルの文脈で、非同義対同義率比の古典的な概念と同等の定義と計算の方法を提案するこ 集団遺伝学の第一原理を用いることにより,蛋白質コード遺伝子のコドン部位に作用する選択係数の関数としてωの発現を得ることができることが期待されている。 これは、コドン部位の進化のダイナミクスに多くの洞察を提供する必要があり、それはタンパク質コード遺伝子の適応進化を検出するための統計モデ
部位ごとの突然変異選択モデル
n個の一倍体ゲノムを持つ集団におけるタンパク質コード遺伝子におけるコドン部位kの進化を考 部位が現在コドンiに対して固定されていると仮定する(すなわち、すべてのN個の対立遺伝子が部位kにおいてiを運ぶ)。 変異選択フレームワークでは、置換率(新規変異コドンJが出現し、最終的に集団内で固定される速度)は、
ここで、μ ijはIからJへの中立変異率であり、SIJ,k=FJ,k–FI,kはコドンJおよびfj,k=2nfj,kを支持する選択係数である。は、自然選択が相対置換率に影響を与えることを示している。 突然変異が有利である場合(SIJ,k>0)、置換率は中立率(qIJ,k>μ ij)よりも高いが、突然変異が有害である場合(SIJ,k<0)、置換率は低減される(qIJ,k<0)、置換率は低減される(qIJ,k<0)。<µ ij)。 ここで、本発明者らは、同義語置換が中性であると仮定し(SIJ、k=0)、したがって、部位kでの進化は、2 0個のアミノ酸適合度によって決定される。 Μ ijは、標準的なDNA置換モデルから構築することができる(例えば、I=TTTおよびJ=TTCの場合、Hky置換モデルの下の<div id=“0ab0 5 3 6 8 3e”></Div><div id=“2 9 8 6b9f7 2f”>
式(2.1)は、集団におけるコドン置換を連続時間マルコフ過程として記述する。 これは、世代ごとの突然変異率が母集団サイズ()と比較して小さい場合に賢明です。 サイトkがIに対して固定される時間nI,kの割合(すなわち、Iの固定頻度)は、
であり、は、中立的に進化するシーケンス(すなわち擬似遺伝子)の頻度である。 したがって、時間の経過とともに平均化されたkでの置換率は、
であり、合計はすべてのコドン対I≤J以上です。そうでない場合は0になります。 同義速度p s,kは部位間で変化することに留意されたい(例えば、部位がメチオニンについて保存されている場合、同義速度はゼロである)。 中立的に進化するシーケンスの場合、速度は
式(2.1)は瞬間的な置換速度、すなわち、現時点でIに対して固定されているサイトkに 一方、pkは平衡状態での速度であり、すべてのコドンにわたって平均化され、それらの定常周波数によって重み付けされる。相対的非同義置換率
サイトkにおける絶対非同義対同義置換率比は、pN,k/pS,kである。
サイトkにおける絶対非同義対同義置換率比は、pN,k/pS,kである。
別の方法として、wkを相対的な非同義率wk=cpN,kとして定義することができます。 明白な解決策は、上記と同じ定義につながるです。 Cはサイト上で一定であるという望ましい特性を有することに留意されたい。 読者は、同義語率が式(3.1)から脱落することに驚くべきではない。 統計的推論を行う場合、同義置換は中立突然変異率に関する情報を有するため、の値を通知します。 同様に、サイトkにおける相対同義語率は、
図1aは、顕花植物のrbcL遺伝子の例を示しています。 適応度値はTamuriらによってHalpern–Brunoモデルの下で推定された。 ここでは、それらの値を使用してwkとykを計算します。 サイト全体の平均レートは、です。 多くの部位では、同義語速度は中立的に進化する配列(すなわちyk>
適応進化中の非同義率
アミノ酸の適合度が時間を通して一定である場合、サイトは最適なアミノ酸のために固定された 場合によっては、最適以下のアミノ酸が固定され、短期間の進化時間の後に置換されることがあります。 これは、サイトでの非同義の速度が、中立的に進化する配列の速度と比較して低下することを意味する(すなわち、wk<div id=“c2 1 9e2 6 7 8 1”></div>1)。 しかし、部位での適合度が経時的に変化する場合(例えば、環境シフト後または激しい周波数依存選択下)、非同義速度は、中立的に進化する配列(wk>1)と比較して加速され得る。 新しい環境への適応として適合度が変化する場合を研究した。
Iの適合度がであるサイトkを考えてみましょう。です。 さて、環境が変化することを想像してみてください(例えば、突然寒い気候に住む哺乳類の集団、または新しい宿主の細胞内環境が貯水池宿主とは異な 新しい環境BにおけるIの適合度は、になりました。 環境シフトの瞬間にサイトが現在Iで固定されている確率は。 したがって、環境シフトで予想される絶対および相対非同義率は、
フィットネス値のシフトが大きい場合、レートは大幅に加速されます()。
図1bは、インフルエンザウイルスのpb2遺伝子の例を示しています。 適応度値はTamuriらによってHalpern–Brunoモデルの下で推定された。 . 25の適応部位のサブセット(適合度は、ヒト対鳥宿主で進化するウイルスのために異なる)は、Tamuriらによって同定された。 およびTamuriらによって推定されたそれらの適合度。 . ここでは、wk、yk、およびを計算するために推定値を使用します。 ヒトインフルエンザの古典的な系統は、おそらく二十世紀初頭に鳥から哺乳類の貯水池にホストシフトに由来します。 We calculate at the putative host shift. The average rate at adaptive sites is (across all sites and ). Note that for 16 sites for which fitnesses are different between hosts, we find that . これは、適応進化を検出するための基準wk>1がこの場合には保守的であることを示しています。
サイトがiに対して固定されている確率、環境シフト後の時間tは
ここで、を計算することによって。 したがって、シフト後の時間tの絶対および相対的な非同義率は、
式(4.2)の遷移確率は時間の指数関数的減衰関数であるため、式(3.1)で与えられた静止値に近づきます。 言い換えれば、環境シフトの直後に、適合性が変化した部位で適応置換のバーストが起こり、タンパク質コード遺伝子が適応平衡状態に達するまで置換が蓄積する。 例えば、図2aは、ホストシフト後のpb2遺伝子の25の適応部位に対する
結論
以前の著者は、非同義率と選択係数との関係がほぼω=S/(1-exp(−S))であることを示していますが、近似は無限サイトモデルに依 方程式(3.1)と(4.1)は、より現実的な近似を提供しますが、視覚化するのは困難です。 I用に固定されたサイトを考えてみましょう。 次の突然変異がJになる確率は、I≤Jのです。 したがって、サイトkでの突然変異の平均選択係数は、
図2bは、適合度が一定である場合、または環境に応じてシフトする場合のシミュレートされたサイトのの関数としてwkを示しています。 近似ω=S/(1−exp(-S))は、wkの妥当な下限を提供することに注意してください。 一般に、で増加しますが、関係は前の近似ほど単純ではありません。部位ごとの突然変異選択モデルでは、最初に選択係数を計算するので、wkを計算せずに部位が陽性選択下にあったかどうかを知ることができる。 しかし、モデルは過剰パラメータ化され、計算コストがかかり、適合度は大きなデータセットでのみ十分に推定できます。 その代わりに、モデルは進化論的推論とモデル構築において有利であるべきである。 例えば、より複雑なモデル(頻度依存選択、段階的な環境変化への適応、コドン使用上の選択など)の下でのwkの挙動は、部位ごとの変異選択フレームワークの下で研究することもできる。 これは、分子配列における適応進化を検出する私たちの能力に光を当てるので、価値のある努力になります。
データのアクセシビリティ
この研究に付随するデータは、Dryad doi:10.5061/dryadで入手できます。3r3q4。
謝辞
私は貴重なコメントのためにZiheng Yang、Richard GoldsteinとAsif Tamuriに感謝します。
資金調達ステートメント
M.d.R.はBBSRC(UK)grant no. BB/J009709/1Ziheng Yangに授与されました。
利益相反
私は競合する利益を持っていません。
脚注
- 1
Halpern AL&ブルーノWJ. 1998年タンパク質コード配列の進化距離:部位特異的残基頻度のモデル化。 モル バイオル エヴォル 15, 910–917. (doi:10.1093/oxfordjournals.モルベフa025995)。 Crossref,PubMed,ISI,Google Scholar
- 2
Fisher r.1930自然選択の遺伝理論。 イギリス、オックスフォード:クラレンドンプレス。 Google Scholar
- 3
Wright S.1931メンデル集団における進化。 遺伝学16,97-159. PubMed,Google Scholar
- 4
Holder MT,Zwickl DJ&Dessimoz C.2008置換プロセスにおけるサイト間変動に対する系統発生法の堅牢性を評価します。 フィル トランス R.Soc. B363,4013-4021. (doi:10.1098/rstb。2008.0162). リンク、ISI、Google Scholar
- 5
Spielman SJ&ウィルケ株式会社。 2015dN/dSとスケーリングされた選択係数との関係。 モル バイオル エヴォル 32. (doi:10.1093/molbev/msv003)。 Crossref,PubMed,ISI,Google Scholar
- 6
Yang Z&Nielsen R.2008mutation–コドン置換の選択モデルとコドン使用に関する選択的強度を推定するためのそれらの使用。 モル バイオル エヴォル 25, 568–579. (doi:10.1093/molbev/msm284)。 Crossref,PubMed,ISI,Google Scholar
- 7
Rodrigue N,Philippe H&Lartillot N.2010mutation–サイト異種アミノ酸フィットネスプロファイルを持つコード配列進化の選択モデル。 プロク… ナトル-アカデミー所属。 サイ… 米国107、4629-4634。 (doi:10.1073/pnas。0910915107). Crossref,PubMed,ISI,Google Scholar
- 8
Tamuri AU,dos Reis M&ゴールドスタインRA. 2012サイトワイズ変異選択モデルを用いた系統発生データからの選択係数の分布を推定する。 遺伝学190,1101-1115. (土井:10.1534/遺伝学。111.136432). Crossref,PubMed,ISI,Google Scholar
- 9
Tamuri AU,Goldman N&dos Reis M.2014a系統発生データから選択係数の分布を推定するペナルティ尤度法。 遺伝学197,257-271. (土井:10.1534/遺伝学。114.162263). Crossref、PubMed、ISI、Google Scholar
- 10
dos Reis M.2013適応進化の集団遺伝学と置換モデル。 (http://arxiv.org/abs/1311.6682)。 Google Scholar
- 11
Tamuri AU,dos Reis M,Hay AJ&ゴールドスタインRA. 2009年:インフルエンザにおける宿主の変化。 PLoS Comput. バイオル 5、e1000564。 (土井:10.1371/ジャーナル。pcbiだ1000564). 12dos Reis M,Hay AJ&ゴールドスタインRA. 2009ホストシフトイベントを識別するためのヌクレオチド置換の非均質なモデルを使用して:1918’スペイン’インフルエンザパンデミックウイルスの起源 J.モル。 エヴォル 69, 333–345. (doi:10.1007/s00239-009-9282-x)。 Crossref,PubMed,ISI,Google Scholar
- 13
Nielsen R&Yang Z.2003ミトコンドリアおよびウイルスDNAへの応用による系統発生データからの選択係数の分布を推定する。 モル バイオル エヴォル 20, 1231–1239. (doi:10.1093/molbev/msg147)。 Crossref、PubMed、ISI、Google Scholar- 14
Bustamante CD。 2005年分子進化の集団遺伝学。 分子進化における統計的方法(ed. &ニールセンR),pp.63-99. ニューヨーク、ニューヨーク:スプリンガー。 Crossref,Google Scholar - 13