clusterProfilerの使い方
clusterProfilerとは?
clusterProfilerとは、遺伝子のリストに対してGO解析やパスウェイ解析といったエンリッチメント解析を実施するためのソフトウェアです。
遺伝子のリストは、 RNA-Seq解析等のデータから、発現変動遺伝子の抽出(DEG解析)を行うことによって得ることが多いです。
本ページでは、clusterProfilerの使い方やインストール方法を解説します。
インストール
まずはじめに R がない場合には、R をインストールします。(Homebrewを使ったインストール例です。)
$ brew install r
Rを起動して、以下のコマンドを実行して BiocManager および clusterProfiler をインストールします。
> if (!requireNamespace("BiocManager", quietly=TRUE))
> install.packages("BiocManager")
> BiocManager::install("clusterProfiler")
以下のコマンドを実行して、エラーが表示されなければインストール成功です。
> library(clusterProfiler)
必要なアノテーションも準備しておきます。以下はヒトの場合です。
> BiocManager::install("org.Hs.eg.db")
以下のコマンドを実行して、エラーが表示されなければインストール成功です。
> library(org.Hs.eg.db)
データの準備
遺伝子のリストはedgeR等を用いて準備します。以下のようなイメージですべての遺伝子のリスト(all_genes)と発現変動遺伝子のリスト(degs)を取得します。
> all_genes <- rownames(result)
> degs <- rownames(result[result$FDR<0.05,])
edgeRの使い方の詳細はこちらをご覧ください。
GO解析の実施
以下のコマンドで、Gene OntologyのBiological processに対してエンリッチメント解析を実施できます。
> ego <- enrichGO(gene=degs, universe=all_genes, OrgDb=org.Hs.eg.db, ont="BP", pvalueCutoff=0.01, qvalueCutoff=0.05)
以下のように出力されました。
ID Description ... geneID Count
GO:0045930 GO:0045930 negative regulation of mitotic cell cycle ... ENSG00000010244/ENSG00000108691/ENSG0000019878... 5
GO:1901991 GO:1901991 negative regulation of mitotic cell cycle phas... ... ENSG00000010244/ENSG00000108691/ENSG0000019878... 4
GO:0045786 GO:0045786 negative regulation of cell cycle ... ENSG00000010244/ENSG00000108691/ENSG0000019878... 5
GO:0090329 GO:0090329 regulation of DNA-templated DNA replication ... ENSG00000198783/ENSG00000005156/ENSG00000172716 3
GO:1901988 GO:1901988 negative regulation of cell cycle phase transi... ... ENSG00000010244/ENSG00000108691/ENSG0000019878... 4
GO:0010948 GO:0010948 negative regulation of cell cycle process ... ENSG00000010244/ENSG00000108691/ENSG0000019878... 4
以上のようにエンリッチメント解析の結果、遺伝子全体と比較して発現変動遺伝子のリストに有意に多く観測されるGene Ontologyのリストが得られました。
論文に必要な解析が簡単にできるRNA-Seqデータ解析ツール
RNA-Seqデータ解析ツールを利用すれば、外部委託や共同研究者への依頼は必要ありません。高スペックなコンピュータの準備やLinuxコマンドの操作も不要ですので、いますぐにご自身で解析できるようになります。
遺伝子発現量の定量、発現変動遺伝子抽出(DEG解析)、Volcano plot描画、MAプロット描画、ヒートマップ描画、GO解析、パスウェイ解析等 を簡単に実施できます。