主にバイオインフォマティクスで得られるバイオデータ解析にはRやPythonが用いられます。バイオデータ解析にはどちらかというとRが用いられることが多いですが、RよりもPythonの方が汎用言語であり、ほかの処理との組み合わせに有利であることから、ここではPythonによるバイオデータ解析について説明していこうと思います。
なお、バイオデータ解析にはmacOSやLinuxを用いることが多いですが、ここではあえてWindowsユーザーがバイオデータ解析を行うことを想定していきます。
NGS解析環境の構築
ゲノムデータの取得
Pythonを用いた基本的な解析方法
データの取得
NGS関連データ形式の基本操作
- シークエンスデータのファイル形式とBiopythonオブジェクト
- 塩基配列の操作
- FASTQ形式の配列データの品質をPythonでチェックしてみる
- マッピングファイル(SAM/BAM/CRAM形式)の基本操作
- バリアントコールファイル(VCF形式)の基本操作
- ゲノムアノテーションファイル(GFF3形式)の基本操作
相同性検索
- PythonでBLASTする!(基礎編:BLASTとは?)
- PythonでBLASTする!(ローカルBLASTの実行)
- PythonでBLASTする!(ウェブ版BLASTの実行)
- PythonでBLASTする!(BLAST結果のXML解析)