Fisher-Wright突然変異選択フレームワークにおけるタンパク質コード遺伝子の非同義対同義率の計算方法

Introduction

Halpern&Brunoは、Fisher–Wright突然変異、選択および選択のモデルに基づいてタンパク質コード遺伝子の発散を研究するモデルを考案した。ランダムな遺伝的ドリフト。 このモデルでは、遺伝子内の各特定のコドン部位に独自のアミノ酸適合度のセットが割り当てられ、その後、Fisher–Wrightモデルを使用して部位の進化速度を このモデルは近年復活しており、そのバリエーションは、例えば、系統発生推論法の性能を研究し、コドンの使用法を研究し、タンパク質コード遺伝子の選択係数の分布を推定するために使用されている。 おそらく驚くべきことに、このモデルは、タンパク質コード遺伝子の非同義対同義速度比(ω=dN/dSとしても知られている)と適応分子進化の研究におけるその意義のダイナミクスを研究するために使用されていない。

このノートの目的は、Halpern&Brunoの突然変異選択モデルの文脈で、非同義対同義率比の古典的な概念と同等の定義と計算の方法を提案するこ 集団遺伝学の第一原理を用いることにより,蛋白質コード遺伝子のコドン部位に作用する選択係数の関数としてωの発現を得ることができることが期待されている。 これは、コドン部位の進化のダイナミクスに多くの洞察を提供する必要があり、それはタンパク質コード遺伝子の適応進化を検出するための統計モデ

部位ごとの突然変異選択モデル

n個の一倍体ゲノムを持つ集団におけるタンパク質コード遺伝子におけるコドン部位kの進化を考 部位が現在コドンiに対して固定されていると仮定する(すなわち、すべてのN個の対立遺伝子が部位kにおいてiを運ぶ)。 変異選択フレームワークでは、置換率(新規変異コドンJが出現し、最終的に集団内で固定される速度)は、

表示式

2.1

ここで、μ ijはIからJへの中立変異率であり、SIJ,k=FJ,k–FI,kはコドンJおよびfj,k=2nfj,kを支持する選択係数である。は、自然選択が相対置換率に影響を与えることを示している。 突然変異が有利である場合(SIJ,k>0)、置換率は中立率(qIJ,k>μ ij)よりも高いが、突然変異が有害である場合(SIJ,k<0)、置換率は低減される(qIJ,k<0)、置換率は低減される(qIJ,k<0)。<µ ij)。 ここで、本発明者らは、同義語置換が中性であると仮定し(SIJ、k=0)、したがって、部位kでの進化は、2 0個のアミノ酸適合度によって決定される。 Μ ijは、標準的なDNA置換モデルから構築することができる(例えば、I=TTTおよびJ=TTCの場合、Hky置換モデルの下の<div id=“0ab0 5 3 6 8 3e”></Div><div id=“2 9 8 6b9f7 2f”>

式(2.1)は、集団におけるコドン置換を連続時間マルコフ過程として記述する。 これは、世代ごとの突然変異率が母集団サイズ(インライン式)と比較して小さい場合に賢明です。 サイトkがIに対して固定される時間nI,kの割合(すなわち、Iの固定頻度)は、

Display Formula

であり、Inline Formulaは、中立的に進化するシーケンス(すなわち擬似遺伝子)の頻度である。 したがって、時間の経過とともに平均化されたkでの置換率は、

Display Formula

であり、合計はすべてのコドン対I≤J以上です。そうでない場合は0になります。 同義速度p s,kは部位間で変化することに留意されたい(例えば、部位がメチオニンについて保存されている場合、同義速度はゼロである)。 中立的に進化するシーケンスの場合、速度は

Display Formula

式(2.1)は瞬間的な置換速度、すなわち、現時点でIに対して固定されているサイトkに 一方、pkは平衡状態での速度であり、すべてのコドンにわたって平均化され、それらの定常周波数によって重み付けされる。相対的非同義置換率

サイトkにおける絶対非同義対同義置換率比は、pN,k/pS,kである。

相対的非同義置換率

サイトkにおける絶対非同義対同義置換率比は、pN,k/pS,kである。 ただし、同義語レートはサイトによって異なるため、サイトの同義語レート比インライン式インライン式で正規化する必要があります(同義語と非同義の異なる比率を修正するには-中立での同義語置換)。 これは、次の定義につながります。

数式を表示

3。1

別の方法として、wkを相対的な非同義率wk=cpN,kとして定義することができます。 明白な解決策は、上記と同じ定義につながるインライン式です。 Cはサイト上で一定であるという望ましい特性を有することに留意されたい。 読者は、同義語率が式(3.1)から脱落することに驚くべきではない。 統計的推論を行う場合、同義置換は中立突然変異率に関する情報を有するため、インライン式の値を通知します。 同様に、サイトkにおける相対同義語率は、

表示式

3.2

図1aは、顕花植物のrbcL遺伝子の例を示しています。 適応度値はTamuriらによってHalpern–Brunoモデルの下で推定された。 ここでは、それらの値を使用してwkとykを計算します。 サイト全体の平均レートは、インライン式インライン式です。 多くの部位では、同義語速度は中立的に進化する配列(すなわちyk>インライン式

図1.

図1. 相対的な非同義(w k)および同義(y k)の置換率。 (a)単子葉植物(顕花植物)のrbcl葉緑体遺伝子の速度。 (a,b)では、各部位における適合度(FIJ,k)および突然変異パラメータ(インライン式)は、Halpern–Brunoモデルの下でペナルティ尤度(ペナルティα=0.01)によって推定され、からである。 そして、式(3.1)および(3.2)を用いて、wkおよびykを計算する。 (B)では、25の適応部位(赤)は、ヒト対鳥(自然の貯水池)ホストで進化するウイルスの間で適合性が異なる場所で同定された。 各ホストの下のこれらのサイトの適合性は、ペナルティなしで推定され、からである。 次に、式(4.1)を使用して、ホストシフトでインライン式インライン数式の範囲は0.231–7.64です(図では最大値が切り捨てられています)。

適応進化中の非同義率

アミノ酸の適合度が時間を通して一定である場合、サイトは最適なアミノ酸のために固定された 場合によっては、最適以下のアミノ酸が固定され、短期間の進化時間の後に置換されることがあります。 これは、サイトでの非同義の速度が、中立的に進化する配列の速度と比較して低下することを意味する(すなわち、wk<div id=“c2 1 9e2 6 7 8 1”></div>1)。 しかし、部位での適合度が経時的に変化する場合(例えば、環境シフト後または激しい周波数依存選択下)、非同義速度は、中立的に進化する配列(wk>1)と比較して加速され得る。 新しい環境への適応として適合度が変化する場合を研究した。

Iの適合度が環境Aのインライン数式であるサイトkを考えてみましょう。静止周波数と瞬時置換率はインライン式です。 さて、環境が変化することを想像してみてください(例えば、突然寒い気候に住む哺乳類の集団、または新しい宿主の細胞内環境が貯水池宿主とは異な 新しい環境BにおけるIの適合度は、インライン式になりました。 環境シフトの瞬間にサイトが現在Iで固定されている確率はインライン式インライン式。 したがって、環境シフトで予想される絶対および相対非同義率は、

表示式

4です。1

フィットネス値のシフトが大きい場合、レートは大幅に加速されます(インライン式インライン式)。

図1bは、インフルエンザウイルスのpb2遺伝子の例を示しています。 適応度値はTamuriらによってHalpern–Brunoモデルの下で推定された。 . 25の適応部位のサブセット(適合度は、ヒト対鳥宿主で進化するウイルスのために異なる)は、Tamuriらによって同定された。 およびTamuriらによって推定されたそれらの適合度。 . ここでは、wk、yk、およびインライン式を計算するために推定値を使用します。 ヒトインフルエンザの古典的な系統は、おそらく二十世紀初頭に鳥から哺乳類の貯水池にホストシフトに由来します。 We calculate Inline Formula at the putative host shift. The average rate at adaptive sites is Inline Formula (across all sites Inline Formula and Inline Formula). Note that for 16 sites for which fitnesses are different between hosts, we find that Inline Formula. これは、適応進化を検出するための基準wk>1がこの場合には保守的であることを示しています。

サイトがiに対して固定されている確率、環境シフト後の時間tは

表示式

4.2

ここで、インライン式インライン式を計算することによって。 したがって、シフト後の時間tの絶対および相対的な非同義率は、

表示式

式(4.2)の遷移確率は時間の指数関数的減衰関数であるため、インライン式インライン式インライン式式(3.1)で与えられた静止値に近づきます。 言い換えれば、環境シフトの直後に、適合性が変化した部位で適応置換のバーストが起こり、タンパク質コード遺伝子が適応平衡状態に達するまで置換が蓄積する。 例えば、図2aは、ホストシフト後のpb2遺伝子の25の適応部位に対するインライン式

図2.

図2. (a)インフルエンザのpb2遺伝子における2 5個の適応部位(灰色の線)に対する宿主シフト後の相対的な非同義率の崩壊。 実線は、25サイトの平均値であり、インライン式インライン式インライン式(点線)。 (b)サイトにおける平均選択係数の関数としての相対的な非同義率。 ピンクドット: 10 000サイトの適応度値は、平均0とσ=0、…、10の正規分布からサンプリングされました。 次に、式(3.1)および(5.1)を使用してwkおよびインライン式インライン式インライン式インライン式シフトモデル。 実線:S/(1-exp−S))。

結論

以前の著者は、非同義率と選択係数との関係がほぼω=S/(1-exp(−S))であることを示していますが、近似は無限サイトモデルに依 方程式(3.1)と(4.1)は、より現実的な近似を提供しますが、視覚化するのは困難です。 I用に固定されたサイトを考えてみましょう。 次の突然変異がJになる確率は、I≤Jのインライン式です。 したがって、サイトkでの突然変異の平均選択係数は、

表示式

5.1

図2bは、適合度が一定である場合、または環境に応じてシフトする場合のシミュレートされたサイトのインライン式の関数としてwkを示しています。 近似ω=S/(1−exp(-S))は、wkの妥当な下限を提供することに注意してください。 一般に、インライン式インライン式で増加しますが、関係は前の近似ほど単純ではありません。部位ごとの突然変異選択モデルでは、最初に選択係数を計算するので、wkを計算せずに部位が陽性選択下にあったかどうかを知ることができる。 しかし、モデルは過剰パラメータ化され、計算コストがかかり、適合度は大きなデータセットでのみ十分に推定できます。 その代わりに、モデルは進化論的推論とモデル構築において有利であるべきである。 例えば、より複雑なモデル(頻度依存選択、段階的な環境変化への適応、コドン使用上の選択など)の下でのwkの挙動は、部位ごとの変異選択フレームワークの下で研究することもできる。 これは、分子配列における適応進化を検出する私たちの能力に光を当てるので、価値のある努力になります。

データのアクセシビリティ

この研究に付随するデータは、Dryad doi:10.5061/dryadで入手できます。3r3q4。

謝辞

私は貴重なコメントのためにZiheng Yang、Richard GoldsteinとAsif Tamuriに感謝します。

資金調達ステートメント

M.d.R.はBBSRC(UK)grant no. BB/J009709/1Ziheng Yangに授与されました。

利益相反

私は競合する利益を持っていません。

脚注

©2015The Author(s)Published by The Royal Society. すべての権利を保有します。
  • 1
    Halpern AL&ブルーノWJ. 1998年タンパク質コード配列の進化距離:部位特異的残基頻度のモデル化。 モル バイオル エヴォル 15, 910–917. (doi:10.1093/oxfordjournals.モルベフa025995)。 Crossref,PubMed,ISI,Google Scholar
  • 2
    Fisher r.1930自然選択の遺伝理論。 イギリス、オックスフォード:クラレンドンプレス。 Google Scholar
  • 3
    Wright S.1931メンデル集団における進化。 遺伝学16,97-159. PubMed,Google Scholar
  • 4
    Holder MT,Zwickl DJ&Dessimoz C.2008置換プロセスにおけるサイト間変動に対する系統発生法の堅牢性を評価します。 フィル トランス R.Soc. B363,4013-4021. (doi:10.1098/rstb。2008.0162). リンク、ISI、Google Scholar
  • 5
    Spielman SJ&ウィルケ株式会社。 2015dN/dSとスケーリングされた選択係数との関係。 モル バイオル エヴォル 32. (doi:10.1093/molbev/msv003)。 Crossref,PubMed,ISI,Google Scholar
  • 6
    Yang Z&Nielsen R.2008mutation–コドン置換の選択モデルとコドン使用に関する選択的強度を推定するためのそれらの使用。 モル バイオル エヴォル 25, 568–579. (doi:10.1093/molbev/msm284)。 Crossref,PubMed,ISI,Google Scholar
  • 7
    Rodrigue N,Philippe H&Lartillot N.2010mutation–サイト異種アミノ酸フィットネスプロファイルを持つコード配列進化の選択モデル。 プロク… ナトル-アカデミー所属。 サイ… 米国107、4629-4634。 (doi:10.1073/pnas。0910915107). Crossref,PubMed,ISI,Google Scholar
  • 8
    Tamuri AU,dos Reis M&ゴールドスタインRA. 2012サイトワイズ変異選択モデルを用いた系統発生データからの選択係数の分布を推定する。 遺伝学190,1101-1115. (土井:10.1534/遺伝学。111.136432). Crossref,PubMed,ISI,Google Scholar
  • 9
    Tamuri AU,Goldman N&dos Reis M.2014a系統発生データから選択係数の分布を推定するペナルティ尤度法。 遺伝学197,257-271. (土井:10.1534/遺伝学。114.162263). Crossref、PubMed、ISI、Google Scholar
  • 10
    dos Reis M.2013適応進化の集団遺伝学と置換モデル。 (http://arxiv.org/abs/1311.6682)。 Google Scholar
  • 11
    Tamuri AU,dos Reis M,Hay AJ&ゴールドスタインRA. 2009年:インフルエンザにおける宿主の変化。 PLoS Comput. バイオル 5、e1000564。 (土井:10.1371/ジャーナル。pcbiだ1000564). 12

    dos Reis M,Hay AJ&ゴールドスタインRA. 2009ホストシフトイベントを識別するためのヌクレオチド置換の非均質なモデルを使用して:1918’スペイン’インフルエンザパンデミックウイルスの起源 J.モル。 エヴォル 69, 333–345. (doi:10.1007/s00239-009-9282-x)。 Crossref,PubMed,ISI,Google Scholar
  • 13
    Nielsen R&Yang Z.2003ミトコンドリアおよびウイルスDNAへの応用による系統発生データからの選択係数の分布を推定する。 モル バイオル エヴォル 20, 1231–1239. (doi:10.1093/molbev/msg147)。 Crossref、PubMed、ISI、Google Scholar
  • 14
    Bustamante CD。 2005年分子進化の集団遺伝学。 分子進化における統計的方法(ed. &ニールセンR),pp.63-99. ニューヨーク、ニューヨーク:スプリンガー。 Crossref,Google Scholar