【fasterq-dumpの使い方】公共データベースからFASTQファイルを取得
はじめに
次世代シーケンサーから得られるシーケンスデータを用いた論文が投稿される際に、そのシーケンスデータは公共データベースに登録されることが一般的です。 本ページでは、SRA Toolkitのfasterq-dumpを使って公共データベースからFASTQファイルを取得する手順を説明します。
SRA Toolkitのインストール
こちらにバイナリが用意されているのでダウンロードしていきます。
以下の操作でダウンロードと解凍を行います。
(Macの場合)
sratoolkit.*-mac64/bin にパスを通しておくと良いでしょう。
FASTQファイルの取得にはfasterq-dumpを用いますので、fasterq-dumpのヘルプを表示してみます。
以下のような内容が表示されれば成功です。
アクセッション番号の取得
まずはNCBI SRAでダウンロードしたいデータを探します。アクセッション番号をすでにわかっている場合にはこちらの作業は不要です。
以下の画面で表示されるアクセッション番号をメモしておきます。
FASTQファイルの取得
FASTQファイルの取得にはfasterq-dumpを用います。fastq-dumpというツールもありますが、fasterq-dumpはその高速版に当たります。
以下のコマンドで FASTQファイルを取得します。
以下のように表示されたら取得完了です。
カレントディレクトリに「SRR20791120.fastq」が作成されました。
ペアリードに対しては以下のようにオプションを使用することで、ファイルを分けて取得することができます。
「SRR20791120_1.fastq」と「SRR20791120_2.fastq」が作成されました。
論文に必要な解析が簡単にできるRNA-Seqデータ解析ツール
RNA-Seqデータ解析ツールを利用すれば、外部委託や共同研究者への依頼は必要ありません。高スペックなコンピュータの準備やLinuxコマンドの操作も不要ですので、いますぐにご自身で解析できるようになります。
遺伝子発現量の定量、発現変動遺伝子抽出(DEG解析)、Volcano plot描画、MAプロット描画、ヒートマップ描画、GO解析、パスウェイ解析等 を簡単に実施できます。