DEGsとは?発現変動遺伝子の抽出(DEG解析)とは?
📖 RNA-Seqデータ解析の全体の流れも合わせてご覧ください。
DEGsとは?
DEGsとは、Differentially Expressed Genesの略で、異なる条件やグループ間において発現量が大きく上昇または減少した遺伝子のことを言います。
発現変動遺伝子の抽出(DEG解析)とは?
DEGsを抽出するための解析です。RNA-Seq解析やマイクロアレイ等の網羅的な遺伝子発現解析を行った後に、発現変動遺伝子の抽出(DEG解析)がよく行われます。
例えば、ヒトを対象としたRNA-Seq解析を行うと、数万個の遺伝子の発現量が得られますので、そのままでは結果を解釈することが難しいです。 (以下の発現量テーブルの例では、9個の遺伝子についてのみの結果を表示していますが、実際には数万個の遺伝子の結果が得られます)
発現量テーブルの例
このような数万個の遺伝子の中から発現量が大きく上昇または減少した遺伝子を抽出することで、生物学的な解釈がしやすくなります。
以下のように少数の発現変動遺伝子が抽出されます。
発現変動遺伝子の抽出結果の例
抽出結果には、各遺伝子について発現量の変化の大きさを示すlogFC(log2 fold change)や、統計的な有意性を示すp値・FDRが含まれます。logFCやfold changeの詳細はこちらをご覧ください。
発現変動遺伝子の抽出のために様々なソフトウェアが開発されています。edgeRやDESeq2、Ballgownといったソフトウェアが有名です。
発現変動遺伝子の抽出(DEG解析)後の機能解析
発現変動遺伝子の抽出によって遺伝子のリストが得られます。遺伝子リストに含まれる遺伝子が少数の場合には、1つずつ遺伝子を確認していくこともできますが、遺伝子が多い場合には解釈が難しいことがあります。
そこで、発現変動遺伝子の抽出(DEG解析)後には、機能解析を行うことが多いです。機能解析とは、遺伝子リストに含まれる遺伝子がどのような機能に多く関わっているかを調べる解析です。
機能解析を行ううえで、Gene Ontologyやパスウェイを対象にすることが多いです。それぞれ、GO解析、パスウェイ解析と呼ばれたりもします。
GO解析やパスウェイ解析の詳細は以下をご覧ください。
OlvToolsで発現変動遺伝子の抽出(DEG解析)を行う方法
edgeRやDESeq2、BallgownはいずれもR言語での操作が前提となり、RNA-Seqの生データ(FASTQファイル)から解析する場合には、FASTQファイルの前処理や遺伝子発現量の定量が事前に必要になります。
OlvToolsを使うと、R言語やLinuxコマンドの知識や高スペックなコンピュータがなくても、ブラウザ上で発現変動遺伝子の抽出(DEG解析)を実行できます。FASTQファイルのアップロードから遺伝子発現量の定量、発現変動遺伝子の抽出までを簡単な設定だけで行えます。Fold ChangeやFDRで絞り込んだ発現変動遺伝子の一覧を、表として確認・ダウンロードできます。