Pythonでバイオインフォマティクス

主にバイオインフォマティクスで得られるバイオデータ解析にはRやPythonが用いられます。バイオデータ解析にはどちらかというとRが用いられることが多いですが、RよりもPythonの方が汎用言語であり、ほかの処理との組み合わせに有利であることから、ここではPythonによるバイオデータ解析について説明していこうと思います。

なお、バイオデータ解析にはmacOSやLinuxを用いることが多いですが、ここではあえてWindowsユーザーがバイオデータ解析を行うことを想定していきます。

NGS解析環境の構築

ゲノムデータの取得

Pythonを用いた基本的な解析方法

データの取得

NGS関連データ形式の基本操作

相同性検索

RNA-Seq

GDC Data Portal (TCGAデータベース)の解析

Pythonパッケージ

バイオインフォマティクス総合

データベースアクセス

  • BioServices
  • GOATOOLS

NGS関連ファイル操作

RNA-Seq

  • pyrpipe
  • RSeQC
  • Scanpy

関連情報

おススメ書籍