バイオインフォマティクスとは?

バイオインフォマティクスとは?

バイオインフォマティクスとは、コンピュータを用いて生命科学の現象を解き明かす分野で、生命情報科学や生物情報学、情報生物学とも呼ばれます。 生命科学の分野における実験機器の発展により扱うデータの量が多くなったことから情報科学分野との融合が進んできました。

バイオインフォマティクスの歴史

バイオインフォマティクスの歴史は、1953年にDNAの二重らせん構造が提唱されたことが1つの契機となります。 この発見は、分子生物学の基礎を築き、その後のバイオインフォマティクスの発展の道を開きました。 1977年には、サンガーシーケンシング法が開発され、DNA配列の決定が可能となると、1990年にはヒトゲノム計画が始まり、2004年にヒトゲノム計画完了宣言がなされました。 このプロジェクトには、バイオインフォマティクスが大きな役割を果たしました。 2007年には次世代シーケンサー(Next-Generation Sequencers, NGS)が登場し、シーケンスコストが劇的に下がりました。 これにより、シーケンスデータが爆発的に増加し、バイオインフォマティクスはますますその重要性を増しています。

バイオインフォマティクスのツール例

BLAST

配列間で局所的に類似した領域を見つけるツールです。問い合わせ配列として塩基配列やアミノ配列を入力すると、データベース中の配列と比較して類似性を検索します。

AlphaFold

アミノ酸配列からタンパク質の立体構造を予測するツールです。2020年11月にDeepMind社から発表され、AIを使ってアミノ酸配列からその立体構造を高い精度で予測できることを示し、衝撃を与えました。

GATK

次世代シーケンサーで生成された生データから、一塩基置換や短い挿入欠失等の変異を検出するツールです。

バイオインフォマティクスのデータベース例

国際塩基配列データベース

DDBJ(日本), ENA/EBI(欧州), NCBI(米国)の3つのデータベースがあり、それぞれのデータベースに登録されたデータは相互に交換されます。

タンパク質の立体構造データベース

PDB (Protein Data Bank)があります。タンパク質と核酸の3次元構造データが登録されています。

パスウェイデータベース

KEGGやWikipathwaysがあります。Wikipathwaysは誰でも自由に使うことができますが、KEGGは企業のユーザーが利用するにはライセンスが必要になります。

遺伝子オントロジーデータベース

Gene Ontologyがあります。遺伝子の機能について共通語彙の作成を目指しています。

バイオインフォマティクスの試験

日本バイオインフォマティクス学会から提供されているバイオインフォマティクス技術者認定試験が有名です。受験料は6,000円かかります。

簡易的にバイオインフォマティクスの基礎知識がどのくらい身についているか確認したい場合には、無償で利用できるバイオインフォマティクス検定を是非ご利用ください。

論文に必要な解析が簡単にできるRNA-Seqデータ解析ツール

RNA-Seqデータ解析ツールを利用すれば、外部委託や共同研究者への依頼は必要ありません。高スペックなコンピュータの準備やLinuxコマンドの操作も不要ですので、いますぐにご自身で解析できるようになります。

概要

遺伝子発現量の定量、発現変動遺伝子抽出(DEG解析)、Volcano plot描画、MAプロット描画、ヒートマップ描画、GO解析、パスウェイ解析等 を簡単に実施できます。