バイオインフォマティクス解析に必要なパソコンのスペックは?

はじめに

バイオインフォマティクスをこれから始める人の中には、どんなスペックのパソコンを購入すれば良いか悩まれている方も多いかと思います。本ページでは、バイオインフォマティクス解析を行うためのマシンの選択肢を紹介します。

実施したい解析によって必要なスペックは変わってきますので、あくまで参考としてお考えください。 本記事を読んでも必要なスペックがよくわからない場合は、まずは使う可能性のあるソフトウェアの公式ドキュメントを読んでみることをお勧めします。

MacBook Air / MacBook Pro

MacBook Air / MacBook Proは無難な選択肢です。 下位モデルですとデフォルトのメモリは8GBですので、動かせないソフトウェアが多くなってしまいます。 上位モデルを選択するか、オプションでメモリを増設して、最低でも16GB、可能であれば32GBに変更しておくと安心です。 メモリが32GBあれば、通常の次世代シーケンサー(NGS)解析(参照配列が存在している生物種に対する変異解析やRNA-Seq解析、QIIME2を用いた菌叢解析等)であれば十分足りるかと思います。 既存のソフトウェアを使わずにPython等を用いてデータ分析を行いたいという場合であれば、パソコンのスペックに合わせてスクリプトを書けば良いですので、メモリはそこまで気にしなくても良いでしょう。 また、ストレージに関しては、次世代シーケンサー(NGS)から出力されたデータを扱う場合には256GBですとすぐに足りなくなってしまいますので、1TBや2TBに変更することをお勧めします。

Windowsのパソコンでもバイオインフォマティクス解析を行うことは可能ですが、解析環境の構築が大変になるのでなるべく避けるのが良さそうです。WEB上で見つかる解説記事でも多くがMacを使用することを前提としているという点もMacを進める理由です。初心者の多くは環境構築に躓くことになるかと思いますので、無難なMacを選択するのが良いでしょう。

一点注意点としては、Macに搭載されているチップが、2020年後期からAppleシリコン(M1、M2、M3)に変更されており、今までのIntel搭載Macで動いていたソフトウェアが上手く動作しない可能性があることです。 ただし、Appleシリコン搭載Macの発売から時間も経過してきて、この点に関しては大きな問題にはならなくなってきているかと思います。

クラウド

MacBook Air / MacBook Proは20~60万円程度しますのでかなり高額に感じられる方もいるかと思います。今後バイオインフォマティクスを本格的にやっていこうと決めている方には良い選択肢ですが、「1回限りの解析を行いたい」「まずはお試しで解析をしてみたい」といった場合には難しい選択かと思います。

その場合には、AWS等のクラウドサービスを利用することもできます。そこまでハイスペックの環境を用意するのでなければ、24時間使用しても数百円程度で済みます。

クラウドに接続するための手元のパソコンは必要になりますが、そこまでスペックは必要ありませんので、1回限りもしくはまずはお試しということであればお手持ちのパソコンをご利用いただけるかと思います。

ヒトゲノム解析センター (HGC)等のスパコン

MacBook Air / MacBook Proではメモリやコア数が足りず解析できないことがあります。例えば、 シングルセル解析に使われるソフトウェアはメモリが多く必要になるものが多く、 ソフトウェア「Cell Ranger」では最低でもCPU8コア、 メモリ64GBが必要であると言われていますし、ソフトウェア「Seurat」でも細胞数によっては非常に多くのメモリが必要になると言われています。 このようにメモリやコア数が必要になる解析を行う場合には、ヒトゲノム解析センター(HGC)や遺伝研等のスパコンを利用するのが良いでしょう。学術機関向けであれば比較的安く利用できます。 ヒトゲノム解析センターの料金表はこちらからご覧いただけます。

ただし、これらのスパコンを利用する場合にも、自分の手元で動かすパソコンは必要になってきます。スパコンを操作するだけであれば、そこまでスペックは必要になりませんが、簡単な解析はローカルで実行することを考えるとMacBook Air / MacBook Proを購入しておくのが理想です。

オーダーメイドのワークステーション

外部にデータを出すことができない等の事情により、ヒトゲノム解析センター (HGC)等のスパコンが利用できない場合もあるかと思います。その場合には、オーダーメイドのワークステーションを購入するのが良さそうです。スペックは自由に選択できますので、実施したい解析に合わせてデザインすることができます。こちらで参考事例が紹介されています。

論文に必要な解析が簡単にできるRNA-Seqデータ解析ツール

RNA-Seqデータ解析ツールを利用すれば、外部委託や共同研究者への依頼は必要ありません。高スペックなコンピュータの準備やLinuxコマンドの操作も不要ですので、いますぐにご自身で解析できるようになります。

概要

遺伝子発現量の定量、発現変動遺伝子抽出(DEG解析)、Volcano plot描画、MAプロット描画、ヒートマップ描画、GO解析、パスウェイ解析等 を簡単に実施できます。