GSEA(Gene Set Enrichment Analysis)とは?結果の見方

GSEA(Gene Set Enrichment Analysis)とは、2群間での発現量の変化について遺伝子セットの単位で解釈を行う手法です。 通常のエンリッチメント解析(GO解析パスウェイ解析)では、 2群間で発現が変動した遺伝子群(DEGs、 Differentially Expressed Genes)を抽出して、その遺伝子群において遺伝子全体と比較して有意に多く観測されるGO termやパスウェイを検出します。 一方でGSEAでは、2群間で発現が変動した遺伝子だけではなく、すべての遺伝子の情報を用います。 そのため、個々の遺伝子を見た場合には有意な発現変動を示さないが、遺伝子セットの多くの遺伝子でゆるやかな発現変動を示している場合にも、GSEAでは検出することができます。

GSEAの結果の見方

GSEAでは以下のような図がよく描かれます。

GSEAの結果例

GSEAの結果例

GSEAの解析を行う際にはまずすべての遺伝子を発現量の変化の大きさで並べ替えます。図の横軸は遺伝子の順位を表しており、左に行くほど発現量の変化が大きくなっています。 Enrichment score(ES)は、ランキングの上位から順に遺伝子を見ていって遺伝子セット内に含まれる遺伝子であればスコアを加算し、遺伝子セット内に含まれない遺伝子であればスコアを減算して計算します。 Enrichment score(ES)の高い部分が左側に偏っていれば、発現変動の変化が大きかった遺伝子が遺伝子セット内に多く含まれていることを意味します。

GSEAを実施するには

GSEAはこちらからソフトウェアをダウンロードできます。 Mac、Windows、Linuxバージョンが用意されていますので、ご利用の環境に合わせてダウンロードできます。 また、command lineから実行することもできます。

また、clusterProfilerを利用してGSEAを実施することもできます。Rから実行する場合はこちらを利用するのも良いでしょう。

論文に必要な解析が簡単にできるRNA-Seqデータ解析ツール

RNA-Seqデータ解析ツールを利用すれば、外部委託や共同研究者への依頼は必要ありません。高スペックなコンピュータの準備やLinuxコマンドの操作も不要ですので、いますぐにご自身で解析できるようになります。

概要

遺伝子発現量の定量、発現変動遺伝子抽出(DEG解析)、Volcano plot描画、MAプロット描画、ヒートマップ描画、GO解析、パスウェイ解析等 を簡単に実施できます。