【STARの使い方】RNA-Seq解析におけるマッピング

更新日: 2026/3/5

はじめに

RNA-Seqのシーケンスデータを用いて遺伝子発現量を定量していく際に、一般的に事前にマッピング処理を行います。マッピングとはリード配列 (FASTQファイル)を参照配列の一致する箇所に並べていく処理のことを言います。 RNA-Seqのマッピングによく使われるソフトウェアとして、HISAT2、STAR、Bowtie2といったものがあります。本ページではSTARの使い方を説明します。

RNA-Seq解析の受託を検討している方はこちらにて一括見積が可能です。また、RNA-Seqのデータ解析の一連の流れはこちらをご覧ください。

インストール

STARの公式の情報では、哺乳類のゲノムを扱うには少なくともメモリ16GB、理想的には32GBが必要と書かれていますのでこの点注意が必要です。

Bioconda経由でインストールできます。

$ conda install -c bioconda star

ヘルプを表示してみます。

$ star --help

以下のように表示されればインストール成功です。

Usage: STAR [options]... --genomeDir /path/to/genome/index/ --readFilesIn R1.fq R2.fq Spliced Transcripts Alignment to a Reference (c) Alexander Dobin, 2009-2020 STAR version=2.7.10a STAR compilation time,server,dir= :/Users/travis/build/alexdobin/travis-tests/STARcompile/source For more details see: <https://github.com/alexdobin/STAR> <https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf> ### versions versionGenome 2.7.4a string: earliest genome index version compatible with this STAR release. Please do not change this value! ### Parameter Files parametersFiles - string: name of a user-defined parameters file, "-": none. Can only be defined on the command line. ...

index作成

以下のコマンドでindexを作成します。

$ mkdir genome $ star --runThreadN 4 --runMode genomeGenerate --genomeDir genome --genomeFastaFiles genome.fa --sjdbGTFfile annotation.gtf

--genomeFastaFilesで参照配列のFASTAファイル、--sjdbGTFfileでそのアノテーション（GTFファイル）を渡しています。「genome」ディレクトリにindexが作成されました。

ちなみに、ヒトのゲノムに対してメモリ16GBの環境で解析を行なった場合に、上記のコマンドでは途中でエラーとなってしまいました。私の環境では、--limitGenomeGenerateRAMと--genomeSAsparseDオプションを使うことで無事indexを作成することができました。

indexファイルは文字列を高速に検索するために必要なファイルで、STARに限らずほぼすべてのマッピングソフトウェアにおいて事前作成が必要です。

マッピング

以下のコマンドでマッピング処理を行います。

$ star --runThreadN 4 --genomeDir genome --readFilesIn read_1.fastq.gz read_2.fastq.gz --readFilesCommand gunzip -c --outSAMtype BAM SortedByCoordinate --outFileNamePrefix sample1

無事マッピング結果が得られました。

--outSAMtype BAM SortedByCoordinateオプションを付けておくことで、ソート済みのBAMファイルが出力されます。

結果をIGV等のゲノムブラウザで可視化すると以下のようにマッピングされた様子が確認できます。