【fastpの使い方】FASTQファイルの前処理
はじめに
次世代シーケンサーから出力される生データ(FASTQファイル)には、アダプター配列が含まれているリードや品質の悪いリードが存在しています。 そのため、様々な解析を進める前に、まずはFASTQファイルからアダプター配列をトリミングしたり、品質の悪いリードをフィルタリングしたりする必要があります。
FASTQファイルの前処理を実施するためのソフトウェアの1つが、fastpです。他にもFASTQファイルの前処理に使われるソフトウェアはありますが、fastpはC++で実装されておりマルチスレッドに対応しているため、高速で処理が行える点で優れています。
インストール
CentOSやUbuntuであれば、以下のコマンドでインストール可能です。
Mac等では、上記操作で利用しようとすると以下のようになってしまいます。
その場合は、Bioconda経由でインストールできます。
ヘルプを表示してみます。
以下のように表示されればインストール成功です。
前処理の実施
シングルエンドの場合、以下の操作で前処理を実施できます。
ペアエンドの場合、以下の操作で前処理を実施できます。
GZIP形式に圧縮されたFASTQファイルが出力されました。
以下のようなレポートも出力されます。
レポートの詳細はこちらからご覧いただけます。
論文に必要な解析が簡単にできるRNA-Seqデータ解析ツール
RNA-Seqデータ解析ツールを利用すれば、外部委託や共同研究者への依頼は必要ありません。高スペックなコンピュータの準備やLinuxコマンドの操作も不要ですので、いますぐにご自身で解析できるようになります。以下のような方にオススメです。
✔︎ 外部委託や共同研究者への依頼は行いたくない
✔︎ Linuxコマンドでの操作に不安を感じる
✔︎ 解析に必要な高スペックなコンピュータを持っていない
遺伝子発現量の定量、発現変動遺伝子抽出(DEG解析)、Volcano plot描画、MAプロット描画、ヒートマップ描画、GO解析、パスウェイ解析等 を簡単に実施できます。