HGNCガイドライン

ヒト遺伝子の命名に関する現在のガイドライン

最新のガイドラインについては、https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7494048/(PMID32747822,doi:10.1038/s41588-020-0669-3)。普遍的に合意された代替案が存在しない場合、HGNCは遺伝子の定義を「表現型/機能に寄与するDNAセグメント」として維持する。

実証された機能がない場合、遺伝子は配列、転写または相同性によって特徴付けられ得る」。

各遺伝子には一つのシンボルだけが割り当てられています; HGNCは、通常、アイソフォーム(すなわち、代替転写産物またはスプライス変異体)に名前を付けません。 これは、タンパク質コード遺伝子座のタンパク質コードまたは非コードRNAアイソフォームまたは非コードRNA遺伝子座からの代替転写物のための別個の記号 例外的な状況では、コミュニティの要求に続いて、複雑な遺伝子座、例えばUGT1遺伝子座の遺伝子セグメントについて別々のシンボルが承認されている。 推定される二シストロニック遺伝子座には、別個の遺伝子産物を表すために別個の記号を割り当てることができる。

私たちが名前を付けるすべての遺伝子には、一意のシンボルHGNC IDが割り当てられます(HGNCの形式で)。:#)および説明的な名前。 記号には大文字のラテン文字とアラビア数字のみが含まれ、句読点は避けられますが、特定のグループのハイフンは例外です。 記号は、データ検索を容易にするために、一般的に使用される略語と同じであってはなりません。 命名法には、遺伝子の種や「G」への参照を含めるべきではなく、攻撃的または軽蔑的であってはなりません。

タンパク質コード遺伝子

遺伝子産物の重要な正常な機能に基づいてタンパク質コード遺伝子を命名することを目指しています。

機能データがない場合、タンパク質コード遺伝子は以下の方法で命名することができる:

  1. 遺伝子によってコードされる認識された構造ドメイ1ホモログa”)
  2. 開いている読み取りフレームの存在にのみ基づいています(例えば、 C17orf50,”chromosome17open reading frame50″)

可能であれば、関連遺伝子は、一般的に配列相同性、共有機能またはタンパク質複合体のメンバーシップに基づいて、グループ化を可能にするために、共通のルートシンボルを使用して命名される。

特定の免疫プロセスに関与する遺伝子、または酵素、受容体、またはイオンチャネルをコードする遺伝子については、専門の命名グループに相談してく 他の主要な遺伝子グループについては、新しいメンバーに命名し、提案された命名法の更新を議論するときに顧問のパネルに相談します。

Pseudogenes

pseudogeneは、機能的なタンパク質産物を産生することはできないが、機能的な遺伝子と高いレベルの相同性を有する配列として定義される。 一般に、我々は、機能的な祖先遺伝子のかなりの割合に相同性を保持する偽遺伝子のみを命名する。

処理された偽遺伝子は、特定の親遺伝子に基づいて命名され、親遺伝子記号にPと番号が付加されます(例:NACAP10、”NACA pseudogene10″)。 番号付けは、通常、種特異的です。

他のファミリーメンバーと比較してコード配列の大部分を保持する(通常は未処理である)擬似遺伝子は、”P”接尾辞を持つ新しいファミリーメンバー、例えばDDX12P、”DEAD/H-box helicase12、pseudogene”として命名される。 この命名形式は、他の種におけるそれらの機能的オルソログに関連して偽生成された遺伝子にも使用される。 例えばMMP23A;”matrix metallopeptidase23A(pseudogene)”のように、記号が十分に確立されている場合、そのような擬遺伝子には”P”が含まれないことはめったにない。詳細な説明については、最近のレビュー(https://www.embopress.org/doi/full/10.15252/embj.2019103777)を参照してください。

非コードRNA遺伝子

非コードRNA(ncRNA)遺伝子をRNAタイプに応じて命名します。https://www.embopress.org/doi/full/10.15252/embj.2019103777)。

エキスパートリソースが存在する小さなRnaについては、以下の命名規則に従います。

MicroRNAs miRBaseは、各micrornas stem‐loopシーケンスに”mir‐#”の形式のシンボルを割り当て、各成熟miRNAに”miR‐#”の形式のシンボルを割り当て、その後にデータベースへの提出順序を反映する一意の連番を付けます。 次いで、HGNCは、mir#の形式でヒトmiRNA遺伝子の遺伝子記号を承認する;例えば、MIR1 7はmiRNA遺伝子を表し、mir−1 7はステム−ループを表し、miR−1 7は成熟miRNAを表す。 転写Rna(tRNA)ゲノムt RNAデータベース(Gtrnadb)()は、trna−−−の形式、例えばtRNA−Ala−AGC−1−1で各tRNA遺伝子に固有のIDを割り当てる。 HGNCは、tr‐の形式でわずかに凝縮されているが同等のtRNA遺伝子記号を割り当て、例えばTRA‐AGC1‐1

小さなncRNAの他のクラスは、専門家顧問と共同で命名されている。 小さいncRNAの主要なクラスは下記のものを含んでいます:

“RNA,u#small nuclear”のルートシンボル”RNU”で命名された小さな核rna SNORD#”small nucleolar RNA,C/D box”遺伝子のルートシンボル”SNORA#”small nucleolar RNA,H/ACA box”遺伝子のルートシンボル”snora#”small nucleolar rna,H/ACA box”遺伝子のルートシンボル”SNORA#”small Nucleolar rna,H/ACA box”遺伝子のルートシンボル”SNORA#”small Cajal body‐specific RNA”遺伝子のルートシンボル”RNA45S,RNA28S,RNA18S,RNA5S,RNA5-8S”で命名されたリボソームRna長い非コードRna(lncrna)は、タンパク質コード遺伝子に類似した公開された機能に基づいて、優先的に固有のシンボルが与えられる。 RefSeqおよびGENCODEプロジェクトによって注釈されているlncrna遺伝子には、シンボルのベースとなる適切な公開情報が存在しないlncrna遺伝子が、以下の系統的な方法で命名されている。

  • タンパク質コード遺伝子に関して遺伝子間であるLncrnaには、ルートシンボル-LINC#に続いて5桁の番号が割り当てられている。例えば、 FAS‐AS1
  • タンパク質コード遺伝子に分岐する(双方向プロモーターを共有する)Lncrnaには、シンボルフォーマット-DT例えばABCF1‐DT
  • 同じ鎖上のタンパク質コード遺伝子のイントロン内に含まれるLncrnaには、シンボルフォーマット-IT#例えばAOAH‐IT1
  • 同じ鎖上のタンパク質コード遺伝子に重複するLncrnaには、シンボルフォーマット-OT#が割り当てられる。例えば、イントロンまたはエクソン内にマイクロrnaまたはsnoRNA遺伝子を含むC5−ot1</LI><Li>lncrnaは、例えば、宿主遺伝子として命名される。 【0 0 2 5】MIR1 7HG、SNHG7</li></ul><h2>リードスルー転写物は、通常、隣接遺伝子座から産生され、2つ(またはそれ以上)の遺伝子のコード部分および/または非コード部 HGNCは、NCBIのRefSeqアノテータとEnsemblのGENCODEアノテータの両方によって一貫してアノテーションされた読み取り転写物のみを指定します。 これらの転写物は、遺伝子座タイプ「readthrough transcript」を有し、ハイフン、例えばZNF511-PRAP1、および名前「readthrough」、例えば「ZNF511-PRAP1readthrough」で分離された親遺伝子からの2つ(またはそれ以 名前はまた、「(NMD候補)」のような転写物の潜在的な符号化状態に関する追加情報を含むことができる。

    遺伝子は、集団のサブセット内にのみ存在する

    歴史的に、HGNCはヒト参照ゲノム上にある遺伝子のシンボルのみを承認しています。

    遺伝子は、ヒト参照ゲノム上にある遺伝子のシンボルのみを承認しています。 HLAコミュニティのような専用の命名委員会を持つ特定のコミュニティから要求された場合、まれな例外が行われています。 構造変異体の将来の命名は、Genome Reference Consorition(GRC)によってヒト参照ゲノムに組み込まれた代替遺伝子座上のものに限定されるであろう。 アンダースコア文字は、代替参照遺伝子座に注釈された遺伝子のために予約されており、例えば、C4B_2は、6p21.3代替参照遺伝子座上のC4Bの第二のコ

    注:HGNCは、もはや表現型(お問い合わせOMIMを参照してください)またはゲノム領域に名前を付けない、また我々は、ヒトゲノム内のトランスポーザブル要素挿入 遺伝子転座または融合の産物については、転写産物の読み取りを承認するSYMBOL1-SYMBOL2形式との混同を避けるために、SYMBOL1/SYMBOL2形式をお勧めします。 配列変異体の命名法は、HGVのremitである。 タンパク質命名法については、HGNCの関与で書かれたInternational Protein Nomenclature Guidelinesを参照してください。 これらのガイドラインに同意して、”タンパク質と遺伝子のシンボルは同じ略語を使用する必要があります”、タンパク質は遺伝子と区別するために非

    種間のオルソログの命名

    脊椎動物(および適切な場合は非脊椎動物)種間のオルソログ遺伝子は同じ遺伝子記号を持つことをお勧めします。 同じ遺伝子記号を持つ相同遺伝子の起源の種を区別するために、我々は、NCBI分類idだけでなく、種名またはGenBank共通名、例えば分類ID:9598とパンtroglodytesまたはチンパンジーのいずれかを引用することをお勧めします。

    脊椎動物遺伝子命名委員会

    脊椎動物遺伝子命名委員会(VGNC、)は、現在、独自の命名委員会を欠いている脊椎動物種の遺伝子に標準化された命名法を割り当てるための責任HGNCの拡張です。 VGNCは、5つの確立された既存の脊椎動物命名委員会、MGNC(マウス)、RGNC(ラット)、CGNC(ニワトリ)、XNC(アフリカツメガエル)およびZNC(ゼブラフィッシュ)と調整して、脊椎動物の遺伝子がそれらのヒト同族体に沿って命名されることを保証する。

    ヒトC#orf#遺伝子の脊椎動物のオルソログには、他の種の染色体番号を接頭辞としてヒト記号とヒトを示すHが割り当てられています。

    ヒトc#orf#遺伝子の脊椎動物のオルソログには、ヒト記号が割り当てられています。 例えば、ヒトC1Orf100のオルソログが牛16番染色体上にあるので、牛のシンボルはc16H1Orf100であり、対応する遺伝子名は”16番染色体C1Orf100ホモログ”である。

    複雑な進化の歴史を持つ遺伝子ファミリーは、嗅覚受容体およびシトクロムP450遺伝子ファミリーに既に実装されているように、理想的には、この分野の専門家の助けを借りて命名する必要があります。

    以前のHGNCガイドライン

    以前のHGNCガイドラインはhttps://www.genenames.org/about/old-guidelines/にあります。

コメントを残す

メールアドレスが公開されることはありません。