GO 解析

GO は gene ontology のことであり、遺伝子の生物的プロセス、細胞の構成要素および分子機能に着目して、遺伝子に付けられるアノテーションである。ある遺伝子に付けられた GO を調べることによって、その遺伝子の機能や細胞内局在がある程度推定できる。

RNA-seq を利用して発現変動遺伝子を同定する場合、データセットによっては数百から数千個もの遺伝子が発現変動していると同定される。このような大量な遺伝子に対して、GO 解析を一つの解釈方法として用いることが多い。英語で GO analysis または GO enrichment analysis など表記される場合が多い。

研究がなされていない遺伝子などについては GO が付けられていない。また、GO が付けられている遺伝子については、1 つないし複数付けられる場合がある。機能または細胞局在性が似ているな遺伝子同士には同じ GO が付けられる。例えば、あるデータセットが数万個の遺伝子を含むならば、データセット全体として数千種類以上の GO が付けられる。これらの GO をすべて調べた後に、各 GO の頻度を計算することができる。一方、このデータセットから発現変動遺伝子を数千個同定したとする。これら数千個の発現変動遺伝子についても各 GO の出現頻度を計算することができる。GO 解析は、各 GO に対して両者(データ全体と発現変動遺伝子)における出現頻度に有意差を持つかどうかを検定する。その特徴からフィッシャー検定などが用いられる。(下図では見やすいように GO の数を 5 つだけ取り上げて円グラフに表わしている。実際には、すべての GO についてその頻度を調べる必要がある。)

GO解析の手順

上図の例では GO:0045202(Quick GO)と GO:0044456(Quick GO)が、全遺伝子と発現変動遺伝子の両者において有意差が見られる。2 つの GO Term と Definition などを調べれば synapse 関連であることがわかる。つまり、この例では神経関連または脳に局在するする一連の遺伝子が発現変動を起こしていることが推定できる。

R パッケージ

統計解析用フリーソフトウェア R 上で利用できる GO 解析のパッケージは Bioconductor で多数提供されている。いずれも詳細なドキュメントが付いており、R ユーザーにとっては入門しやすいといえる。多数のパッケージのうち、いくつかを以下にリストアップし、その使い方を簡単に紹介する。

GO.dbGO のオントロジー、定義や類似語などを R のオブジェクトとして保存し、R から簡単に取り扱えるようにしたパッケージ。
GOFunctionEntrez Gene ID を与えると、それらの遺伝子に結び付けられた遺伝子オントロジーをグラフに描くパッケージ。
goProfilesEntrez Gene ID を与えると、その遺伝子に結び付けられた GO term の出現頻度などを計算し、棒グラフにプロットできるなどの機能を実装したパッケージ。
goseqRNA-seq に対応した GO 解析用のパッケージ。
GOstatsRNA-seq に対応した GO 解析用のパッケージ。
clusterProfilerRNA-seq に対応した GO 解析、KEGG パスウェイ解析用のパッケージ。
topGOFisher 検定、t 検定、Kolmogorov-Smirnov 検定などによる GO 解析。

References

  • Ashburner M, Ball CA, Blake JA, Botstein D, Butler H, Cherry JM, Davis AP, Dolinski K, Dwight SS, Eppig JT, Harris MA, Hill DP, Issel-Tarver L, Kasarskis A, Lewis S, Matese JC, Richardson JE, Ringwald M, Rubin GM, Sherlock G. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nat Genet. 2000, 25(1):25-9. PubMed Abstract
  • Huntley RP, Sawford T, Martin MJ, O'Donovan C. Understanding how and why the Gene Ontology and its annotations evolve: the GO within UniProt. Gigascience. 2014, 3(1):4. PubMed Abstract