Bio.SeqIO モジュール

[APIドキュメント] [toc]

サブモジュール

※ Bio.SeqIO パッケージに含まれるサブモジュール

関数

convert(in_file, in_format, out_file, out_format, alphabet=None)

@ [APIドキュメント] ↑

引数
- in_file：入力ファイルのファイル名 <str>
- in_format：入力ファイルのフォーマット(小文字で指定) <str>
- out_file：出力ファイルのファイル名 <str>
- out_format：出力ファイルのフォーマット(小文字で指定) <str>
- alphabet
戻り値：レコード数 <int>

シークエンスファイルのフォーマットを変換します。戻り値は含まれているレコード数です。

parse(handle, format, alphabet=None)

@ [APIドキュメント] ↑

引数
- handle：ファイル名を表す文字列、もしくはそのテキストストリーム <str / io.TextIOWrapper>
- format：ファイルフォーマットを表す文字列 <str>
- alphabet：ファイルからシークエンスタイプを自動で推測できない場合に指定する文字列 <str>
戻り値：
- ret : handleから読み込まれたSeqRecordオブジェクトのジェネレータオブジェクト <generator(SeqRecord)>

ファイルやテキストストリームに含まれるシークエンスを、1つ1つのシークエンスごとにSeqRecordオブジェクトに変換し、それをまとめたジェネレータオブジェクトとして取得します。

サンプルコード・解説記事

FASTAファイルに複数のエントリーが含まれる場合 (シークエンスデータのファイル形式とBiopythonオブジェクト)

from Bio import SeqIO
records = SeqIO.parse('multi_seq.fasta', 'fasta')
for record in records:
    print('------------------------------')
    print(record)

read(handle, format, alphabet=None)

@ [APIドキュメント] ↑

引数
- handle：ファイル名を表す文字列、もしくはそのテキストストリーム <str / io.TextIOWrapper>
- format：ファイルフォーマットを表す文字列 <str>
- alphabet：ファイルからシークエンスタイプを自動で推測できない場合に指定する文字列 <str>
戻り値：
- ret : handleから読み込まれたSeqRecordオブジェクト <SeqRecord>

単一のシークエンスを表すファイルやテキストストリームをSeqRecordオブジェクトとして読み込みます。複数のシークエンスが含まれる場合は ‘more than one record found in handle’ を返します(この場合はparse関数を用います)。

サンプルコード・解説記事

FASTAファイルに含まれるエントリーが1つのみの場合 (シークエンスデータのファイル形式とBiopythonオブジェクト)

from Bio import TogoWS, SeqIO
with TogoWS.entry('nucleotide', 'NC_045512.2', 'fasta') as handle:
    record = SeqIO.read(handle, "fasta")

write(sequences, handle, format)

@ [APIドキュメント] ↑

引数
- sequences : ファイルに保存するSeqRecordオブジェクト、もしくはそのリスト <SeqRecord / list(SeqRecord)>
- handle : 書き込みを行うファイルオブジェクト、もしくはファイル名 <str>
- format : ファイルフォーマット <str>
戻り値
- count : 書き込みを行ったレコード数 <int>