【NovaSeq/HiSeq/NextSeq/MiSeq】イルミナの次世代シーケンサーの原理と特徴

イルミナ(Illumina)社は遺伝子解析技術で世界的に有名な企業であり、イルミナの次世代シーケンサーは圧倒的なシェアを誇っています。本記事では、イルミナの次世代シーケンサーの原理や特徴について詳しく紹介します。

なお、イルミナの次世代シーケンサーにも多くの種類があります。NovaSeq、HiSeq、NextSeq、MiSeq等の違いについても解説します。

イルミナの次世代シーケンサーの原理

イルミナの次世代シーケンサーではSequence by Synthesis(SBS)テクノロジーが用いられています。 まず、シーケンスしたいDNA配列を断片化し、DNA断片に対してアダプター配列を付加します。 フローセルと呼ばれる基盤上には、アダプター配列と相補的なDNA配列が埋め込まれており、これによりDNA断片はフローセルに結合します。 フローセル上でDNA断片の増幅を行うと、同一DNA断片が集まったクラスターが形成されます。 この状態で、蛍光標識したヌクレオチドを1塩基ずつ伸長させていきます。 この様子をカメラで撮影することによって、大量のクラスターの塩基配列を並列に特定します。

さらに詳しい説明はこちらをご覧ください。

イルミナの次世代シーケンサーの特徴

イルミナの次世代シーケンサーの特徴は1度に大量のデータが出力される点です。 従来のサンガー法はもちろん、PacBioやNanoporeといった他の次世代シーケンサーと比較しても多くのデータが得られます。 その分、データあたりのコストは抑えてシーケンスが可能です。 読み取りの精度についても、PacBioやNanoporeと比較して高い値になっています。

ただし、得られる配列のリード長(解読配列長)は〜数百塩基程度と短くなっています。そのため、リピート領域やGCリッチな領域を解析することは苦手としています。

また、イルミナの次世代シーケンサーの特徴として、DNA断片の片側のみをシーケンスするシングルエンドとDNA断片の両端を読み取るペアエンドの2つの読み方があります。 ペアエンドでシーケンスした場合には、塩基配列がペアになって出力されます。

イルミナの次世代シーケンサーの応用

全ゲノムシーケンス解析(WGS)、全エクソームシーケンス解析(WES)、de novo ゲノム解析、RNA-Seq解析、細菌叢解析等様々な解析に応用されています。

全ゲノムシーケンス解析(WGS)や全エクソームシーケンス解析(WES)において構造変異のように大きな変異を捉えたい場合や、de novo ゲノム解析のようにアセンブルを行う場合には、イルミナの次世代シーケンサーのようなショートリードはあまり向いていません。 そのため、PacBioやNanoporeのようなロングリードを用いることが理想です。 ただし、ロングリードはデータあたりのコストが高いため、実際にはショートリードが使われることもあります。

イルミナの次世代シーケンサーも含めた次世代シーケンサーの応用についてさらに詳しい説明はこちらをご覧ください。

イルミナの次世代シーケンサーの種類

イルミナの次世代シーケンサーのうちいくつか紹介します。

出力データやリード長に違いはありますが、得られるシーケンスの品質は大きく違いはないと言われています。

NovaSeq(NovaSeq 6000、NovaSeq X)

ヒト全ゲノムシーケンス(WGS)等の大量のデータを必要とするアプリケーションを実施する際によく利用されます。 次世代シーケンスの受託解析を行っている企業や大規模な研究拠点はNovaSeq 6000を保有していることが多いようです。

HiSeq(HiSeq1000、HiSeq 2000、HiSeq 2500、HiSeq 3000、HiSeq 4000、HiSeq X)

HiSeqシリーズは1000ドルゲノムを達成する等、ヒトゲノムの研究に大きな影響を与えてきた機器ですが、現在は製造を中止しておりNovaSeqへの移行が進んでいます。

NextSeq(NextSeq 550、NextSeq 1000、NextSeq 2000)

ヒト全ゲノムシーケンス(WGS)と比べて少ないデータ量で済む、エクソームシーケンスやRNA-Seq等のアプリケーションを実施する際によく利用されます。大学の共同利用機器として配備されていることも多いようです。

MiSeq

エクソームシーケンスやRNA-Seq等と比べてさらに少ないデータ量で済む、ターゲットシーケンスや腸内細菌叢解析等のアプリケーションを実施する際によく利用されます。 NextSeqよりもさらに出力データ量が少なく小回りの利くシーケンサーです。大学の共同利用機器として配備されていることも多いようです。

最大出力および最大リード長は以下のようになっています。

最大出力最大リード長
MiSeq15 Gb2 × 300 bp
NextSeq 550120 Gb2 × 150 bp
NextSeq 1000/NextSeq 2000360 Gb2 × 150 bp
HiSeq 25001 Tb2 × 150 bp
HiSeq X1.8 Tb2 × 150 bp
NovaSeq 60006 Tb2 × 250 bp
NovaSeq X16 Tb2 × 150 bp

イルミナの次世代シーケンサーの受託について

イルミナの次世代シーケンサーの価格は非常に高額です。次世代シーケンサーを利用できる環境がない場合には、受託を依頼することが第一選択肢になるかと思います。

RNA-Seq解析の受託を検討してる方はこちらの記事も是非参考にしてください。

論文に必要な解析が簡単にできるRNA-Seqデータ解析ツール

RNA-Seqデータ解析ツールを利用すれば、外部委託や共同研究者への依頼は必要ありません。高スペックなコンピュータの準備やLinuxコマンドの操作も不要ですので、いますぐにご自身で解析できるようになります。

概要

遺伝子発現量の定量、発現変動遺伝子抽出(DEG解析)、Volcano plot描画、MAプロット描画、ヒートマップ描画、GO解析、パスウェイ解析等 を簡単に実施できます。