NGSで解析したゲノムデータのアラインメントに必要なリファレンスゲノム配列としては「GRCh38/hg38」が広く用いられていますが、最近日本人について解析した「日本人基準ゲノム配列(JG2)」が公開されました。ここでは、このリファレンスゲノム配列について紹介していきます。
[toc]リファレンスゲノム配列(GRCh38/hg38)
リファレンスゲノム配列について
ヒトやその他の生物のゲノム配列は個体ごとに異なるものですが、基準となるゲノム配列がなければ「ある人のゲノム配列がどの程度変異しているのか」などを定量的に評価することができません。そこで様々なゲノム配列をもとにしてその最大公約数的なゲノム配列を基準ゲノム配列として決めるということをしています。
2000年にヒトゲノム計画のドラフト配列が確定するのに前後して、UCSCによって基準ゲノム配列としてのリファレンスゲノム配列の作成が始まりました。2001年にはNCBIもリファレンスゲノム配列の作成に加わり、NCBIを中心としたグループによるリファレンスゲノム配列が公表されるようになりました。現在では、NCBIから発展的にGRC(Genome Reference Consortium) (NCBIやEMBL-EBIなどから構成されるコンソーシアム)となって、リファレンスゲノム配列の作成を行っています。なお、NCBI/GRCのバージョンとは別に、それに相当するUCSCのバージョンのリファレンスゲノム配列も引き続き公表されています。両者は基本的には同じ配列なのですが細部には違いがあるようです。
リファレンスゲノム配列は解析技術の進化などによって継続的にアップデートされており、最新版のゲノム配列はGRCh38/hg38となっています。このうちGRCh38がGRCによって発表されたバージョンで、hg38がUCSCによるバージョンを意味しています。
ヒトのリファレンスゲノム配列の主要なバージョンについては以下の通りです。
リリース日 | NCBI/GRCバージョン | UCSCバージョン |
---|---|---|
2000/5 | – | hg1 |
2001/12 | NCBI Build 28 | hg10 |
2003/7 | NCBI Build 34 | hg16 |
2004/5 | NCBI Build 35 | hg17 |
2006/3 | NCBI Build 36.1 | hg18 |
2009/2 | GRCh37 | hg19 |
2013/12 | GRCh38 | hg38 |
UCSCバージョンは2000/5リリースのhg1からずっと連番だったのですが、2013/12の最新リリースでGRCバージョンと番号をそろえたようです。
なお、リファレンスゲノム配列のすべてのバージョンやNCBI/GRCバージョンとUCSCバージョンとの細かな際については、UCSCのWebsiteのFAQに詳しく書かれていましたので、是非一度ご覧ください。
最新版のリファレンスゲノム配列
現在の最新版のリファレンスゲノム配列は2013/12にリリースされたGRCh38/hg38ですが、リリース後も定期的にパッチが当てられて細かなアップデートな続いています。例えば、GRCh38.p13はGRCh38の13回目のパッチリリースに相当します。
最新版のリファレンスゲノム配列データは以下で入手可能です。
- GRC:https://www.ncbi.nlm.nih.gov/grc/human
- Ensembl (EMBL-EBI):http://ensembl.org/Homo_sapiens/Info/Index
また、NCBI Assembly データベース上ではGRCh38は以下になります。
- https://www.ncbi.nlm.nih.gov/assembly/GCF_000001405.39/ (NCBI Assembly)
ヒト以外のリファレンスゲノム配列
ヒト以外のリファレンスゲノム配列についても同様にGRCやUCSCによって公表されています。例えば、実際に使う可能性が高いものとしてマウスのリファレンスゲノム配列は以下のバージョンがあります。
リリース日 | NCBI/GRCバージョン | UCSCバージョン |
---|---|---|
2001/11 | MGSCv2 | mm1 |
2003/2 | NCBI Build 30 | mm3 |
2007/7 | NCBI Build 37 | mm9 |
2011/12 | GRCm38 | mm10 |
2020/6 | GRCm39 | mm39 |
マウスのリファレンスゲノム配列は今年の6月に新しいGRCm39がリリースされたばかりです。
日本人基準ゲノム配列(JG2)
リファレンスゲノム配列は国際的な基準となるゲノム配列であり、人種に関係なく全人類を対象とした研究には非常に重要なものですが、一方でヨーロッパ系やアフリカ系の人種を基準として作られているので日本人のゲノム配列とは異なる点が多く、日本人を対象とした解析では精度が下がってしまうという問題があります。そこで、国際基準ゲノム配列の日本人版を作成する取り組みが東北大学東北メディカル・メガバンク機構(ToMMo)によって行われています。
2019年に第1版のJG1が公開されて、現在は第2版のJG2が公開されています。なお、データは日本人多層オミックス参照パネル(jMorp)のダウンロードページから取得可能です。
ゲノム配列ブラウザも用意されており、配列データをダウンロードしなくてもブラウザ上から基準ゲノム配列とアノテーションの情報を表示させることも可能です。
なお、ゲノムブラウザの使用方法については、こちらをご覧ください。
従来から広く研究に用いられている国際基準ゲノム配列(GRCh38/hg38など)はヨーロッパ系やアフリカ系の集団のゲノム配列が基準となっているので、今後日本人基準ゲノム配列が研究に用いられることで解析精度の向上が期待されます。
コメント