技術情報
次世代シーケンサーデータ解析ソフトウェア
Flow:参照ゲノム配列へのマッピング
Partek Flow(以下、Flow)は次世代シーケンサーデータ解析ソフトウェアです。次世代シーケンサーから出
力されたリード配列の参照ゲノム配列へのマッピング、マッピング済配列からの遺伝子発現量の定量、マッ
ピング済配列の変異解析などさまざまな解析機能を搭載しています。今回はゲノムデータ解析ソフトウェア
Partek Genomics Suite( 以下、Genomics Suite)には搭載されていなかったリード配列の参照ゲノムへの
マッピング機能について紹介します。
■ 参照ゲノム配列へのマッピング
をRNA-seqという名前のプロトコルとして保存すると、
次 世代 シーケンサーから出力されたリード 配 列を
FASTQファイルのデータノードに対してRNA-seqプロトコ
RNA-seq 、ChIP-seq 、MeDIP-seq、DNA-seqなどのさま
ルを呼び出すだけで6つの解析ノードをまとめて実行で
ざまなアプリケーションの解析に利用するためには、参
きます。
照ゲノム配列へマッピングを行って各配列のゲノム上の位
置情報を決定する必要があります。
シーケンサーメーカーが提供する純正ソフトウェアで
マッピングを行うことも可能ですが、オープンソースの定
評あるマッピングツール(Bowtie、TopHat、BWAなど)も
数多く存在します。しかし、それらのソフトウェアはコマン
ドラインで実行するため、使いこなすには一定の知識が
必要となります。
Flowはこのようなマッピングツールを簡便に使うため
に多くの機能を搭載しています。
■ ワークフローとプロトコル
■プロジェクトとタスク管理
Flowではデータや解析内容をプロジェクトという単位
で管理します。プロジェクトを作成したユーザーは共同研
Flowでは解析内容を図1のようなワークフローとして
究者を登録することで、別のユーザーがそのプロジェクト
表示します。円形のデータノードはFASTQファイルやBAM
のデータを閲覧したり解析を実行したりすることを許可
ファイルなどのデータを、長方形の解析ノードはマッピン
できます。
グ実行、QA/QCレポート作成、塩基のトリム、アダプター
ユーザーがワークフローに追加した解析ノードは、プロ
除去などの操作を表します。ワークフロー機能によって
ジェクトごとのタスクキューにタスクとして登録されます。
解析内容全体を一目で把握することができます。
Flowは全てのプロジェクトのタスクキューに登録されたタ
データノードを選択すると、データの種類に応じた解
スクを登録順に実行します。タスクが完了した時にユー
析項目が自動的に表示されます。例えば、FASTQファイル
ザーにメール通知する機能があります。
を選択すると、Pre-Alignment QA/QCレポート作成、塩
基のトリム、アダプター除去、マッピング実行、アセンブル
■ライブラリ管理
実行といった解析項目が表示されます。
マッピングや遺伝子の定量などに必要な参照ゲノム配
FlowではBowtie、Bowtie2、TopHat、TopHat2、BWA、
列、インデックスファイル、アノテーションファイルは管理
TMAP、SHRiMP2、GSNAP、STARの9種類のマッピング
者が一括してライブラリファイルとして管理できます。ヒ
ツール が 利 用で きます( W i n d o w s 版 で は B o w t i e 、
トやマウスといった代表的な生物種のライブラリファイ
Bowtie2の2種類のみ)。マッピングツールはデータの状
ルはダウンロード元があらかじめ登録されているため、イ
態に応じてパラメーターを調整する必要があります。同じ
ンターネット経由で自動的にダウンロードできます。手動
解析ノードをパラメーターだけ変更して複数回実行する
でダウンロードしたライブラリファイルを登録したり、参
レイヤー機能により、パラメーターの調整にかかる時間
照ゲノム配列からインデックスファイルを作成したりする
を短縮できます。
こともできます。
パラメーターを調整した複数の解析ノードから構成さ
8
図1 ワークフロー
れる一連の解析内容をプロトコルとして保存できます。例
■ご評価
えば、Pre-Alignment QA/QCレポートの作成、クオリティ
Fl owは無 償トライアルによりご評 価いただけます。
値の低い塩基のトリム、Bowtie2でのマッピングの実行、
Genomics Suiteをご利用中のお客様だけでなく、Partek
Post-Alignment QA/QCレポートの作成、遺伝子発現量
社製品は初めての方もぜひお試し下さい。トライアルをご
の定量、遺伝子ごとの発現比較解析の6つの解析ノード
希望される方は弊社Webサイトよりお問い合わせ下さい。
ダウンロード

Flow:参照ゲノム配列へのマッピング