バイオインフォマティクス解析に必要なパソコンのスペックは?

はじめに

バイオインフォマティクスをこれから始める人の中には、どんなスペックのパソコンを購入すれば良いか悩まれている方も多いかと思います。本ページでは、バイオインフォマティクス解析を行うためのマシンの選択肢を紹介します。

実施したい解析によって必要なスペックは変わってきますので、あくまで参考としてお考えください。 本記事を読んでも必要なスペックがよくわからない場合は、まずは使う可能性のあるソフトウェアの公式ドキュメントを読んでみることをお勧めします。

MacBook Pro(13-inch, M2, 2022)

MacBook Proは無難な選択肢です。デフォルトのスペックはCPU8コア、メモリ8GB、ストレージ256GBです。 メモリ8GBですと、動かせないソフトウェアが多くなってしまいますので、メモリは16GB、可能であれば32GBに変更しておくと安心です。 メモリが32GBあれば、通常の次世代シーケンサー(NGS)解析(参照配列が存在している生物種に対する変異解析やRNA-Seq解析、QIIME2を用いた菌叢解析等)であれば十分足りるかと思います。 既存のソフトウェアを使わずにPython等を用いてデータ分析を行いたいという場合であれば、パソコンのスペックに合わせてスクリプトを書けば良いですので、メモリはそこまで気にしなくても良いでしょう。 また、ストレージに関しては、次世代シーケンサー(NGS)から出力されたデータを扱う場合には256GBですとすぐに足りなくなってしまいますので、1TBや2TBに変更することをお勧めします。

Windowsのパソコンでもバイオインフォマティクス解析を行うことは可能ですが、解析環境の構築が大変になるのでなるべく避けるのが良さそうです。WEB上で見つかる解説記事でも多くがMacを使用することを前提としているという点もMacを進める理由です。初心者の多くは環境構築に躓くことになるかと思いますので、無難なMacを選択するのが良いでしょう。

一点注意点としては、Macに搭載されているチップが、2020年後期からAppleシリコン(M1、M2)に変更されており、今まで配布されていたビルド済みパッケージがそのまま利用できない可能性があることです。 将来的には、多くのソフトウェアでAppleシリコン向けのビルド済みパッケージが提供される可能性もありますが、現時点では自分でビルドするかRosetta2を使って対処する必要がありそうです。

クラウド

Macbook Proは20~30万円程度しますのでかなり高額に感じられる方もいるかと思います。今後バイオインフォマティクスを本格的にやっていこうと決めている方には良い選択肢ですが、「1回限りの解析を行いたい」「まずはお試しで解析をしてみたい」といった場合には難しい選択かと思います。

その場合には、AWS等のクラウドサービスを利用することもできます。そこまでハイスペックの環境を用意するのでなければ、24時間使用しても数百円程度で済みます。

クラウドに接続するための手元のパソコンは必要になりますが、そこまでスペックは必要ありませんので、1回限りもしくはまずはお試しということであればお手持ちのパソコンをご利用いただけるかと思います。

ヒトゲノム解析センター (HGC)等のスパコン

MacBook Proではメモリやコア数が足りず解析できないことがあります。例えば、 シングルセル解析に使われるソフトウェアはメモリが多く必要になるものが多く、 ソフトウェア「Cell Ranger」では最低でもCPU8コア、 メモリ64GBが必要であると言われていますし、ソフトウェア「Seurat」でも細胞数によっては非常に多くのメモリが必要になると言われています。 このようにメモリやコア数が必要になる解析を行う場合には、ヒトゲノム解析センター(HGC)や遺伝研等のスパコンを利用するのが良いでしょう。学術機関向けであれば比較的安く利用できます。 ヒトゲノム解析センターの料金表はこちらからご覧いただけます。

これらのスパコンを利用する場合にも、自分の手元で動かすパソコンは必要になってきます。スパコンを操作するだけであれば、そこまでスペックは必要になりませんが、簡単な解析はローカルで実行することを考えるとMacBook Proを購入しておくのが理想です。

オーダーメイドPC

外部にデータを出すことができない等の事情により、ヒトゲノム解析センター (HGC)等のスパコンが利用できない場合もあるかと思います。その場合には、オーダーメイドPCを購入するのが良さそうです。スペックは自由に選択できますので、実施したい解析に合わせてデザインすることができます。こちらで参考事例が紹介されています。