2020年– date –
-
TCGAデータベースを用いたRNA-Seq ― 遺伝子発現量の取得【Python】
がんゲノムデータベースのGDC Data Portal (TCGAデータベース)には様々な癌種の臨床情報からゲノムデータまでが格納されています。純粋なドライな研究としてもウェットの研究の前段階としても、このGDC Data Portalを用いたドライ解析を行うことは非常に重... -
WinUI 3.0 のクラスライブラリを覗いてみる【C#】
UWPアプリのGUIと従来からあるデスクトップアプリのGUIを統合する試みとしてProject Reunionがありますが、その目玉のAPIであるWinUI 3.0のAPIも公開されて徐々に全貌が見えてきました。ここではそのWinUI 3.0のクラスライブラリを覗いてみましょう! なお... -
遺伝子発現量カウントの補正方法(RPM, RPKM, TPM)【Python】
RNA-Seqにおける遺伝子発現量カウントは遺伝子長やリード数などで補正をする必要があります。ここではその補正方法として、RPM/FPM、RPKM/FPKM、TPMについて説明し、Pythonを用いたプログラムで実装してみます。 OS Windows10 + WSL (Windowsユーザーのた... -
GDC Data Portal (TCGA) のデータを取得する
がんゲノムデータベースの一つであるGDC Data Portal (TCGA)からは様々なゲノムデータを取得することができ、がん研究に携わる人は必ず使いこなさないといけない必須スキルとすら言えます。ここでは、GDC Data Portalの使い方について説明していきます。 G... -
htseq-countを用いた遺伝子発現量のカウント【Python】
RNA-Seqのシークエンスデータをマッピングし、それぞれの遺伝子領域にいくつのリードがマッピングされたかをカウントすることで遺伝子発現量を定量化することができます。マッピングファイルから遺伝子発現量をカウントするプログラムはいくつかありますが... -
Windows10のMS-IMEで「かな」「英数」キーを割り当てる方法【Windows】
Windowsユーザーなら、日本語の文書を書こうとして入力したのにIMEがオフで半角の英字が入力されてしまったり、英語の文書を入力しようとしているのに日本語入力になってしまってイライラした経験は必ずありますよね? 今回はWindows10 20H1(バージョン200... -
ゲノムアノテーションファイル(GFF3形式)の基本操作【Python】
ゲノムアノテーションファイルとしてGFF形式やGFF形式から派生したGTF形式などがあります。ここではGFF形式の構造について説明し、Pythonによる基本操作を解説します。 動作確認環境 OS Windows10 + WSL (WindowsユーザーのためのPythonを用いたゲノム解析... -
バリアントコールファイル(VCF形式)の基本操作【Python】
バリアントコールファイル(VCF形式)は一塩基多型(SNP)、挿入欠失(InDel)、コピー数多型(CNV)などのゲノム配列の変異情報を保存するためのデータ形式です。 ここではVCF形式の基本的な事項と、Pythonを用いた基本的な操作方法を説明してきます。 バイオイン... -
マッピングファイル(SAM/BAM/CRAM形式)の基本操作【Python】
NGSからFASTQ形式のデータを取得したら、それをbowtieやHISAT2、STARなどのゲノムマッピングプログラムを用いて、リファレンスゲノム配列にマッピングして解析します。マッピング結果はマッピングファイル(SAM/BAM/CRAM形式)で取得されますが、ここではPyt... -
研究者の評価指標(h-indexとインパクトファクター)
研究に限らず、その人の業績を客観的に評価するのは難しいことです。同じ企業内でも社員の業績評価は難しいのに、異なる施設にいる研究者同士の業績はどのように評価していけばいいのでしょうか。そもそも研究者としてキャリアを積んでいくには何を目指し...