Bio.SeqIO モジュール

Bio.SeqIO モジュール

[APIドキュメント]

サブモジュール

※ Bio.SeqIO パッケージに含まれるサブモジュール

関数

convert(in_file, in_format, out_file, out_format, alphabet=None)

@ [APIドキュメント]

  • 引数
    • in_file:入力ファイルのファイル名 <str>
    • in_format:入力ファイルのフォーマット(小文字で指定) <str>
    • out_file:出力ファイルのファイル名 <str>
    • out_format:出力ファイルのフォーマット(小文字で指定) <str>
    • alphabet
  • 戻り値:レコード数 <int>

シークエンスファイルのフォーマットを変換します。戻り値は含まれているレコード数です。

parse(handle, format, alphabet=None)

@ [APIドキュメント]

  • 引数
    • handle:ファイル名を表す文字列、もしくはそのテキストストリーム <str / io.TextIOWrapper>
    • format:ファイルフォーマットを表す文字列 <str>
    • alphabet:ファイルからシークエンスタイプを自動で推測できない場合に指定する文字列 <str>
  • 戻り値:
    • ret : handleから読み込まれたSeqRecordオブジェクトのジェネレータオブジェクト <generator(SeqRecord)>

ファイルやテキストストリームに含まれるシークエンスを、1つ1つのシークエンスごとにSeqRecordオブジェクトに変換し、それをまとめたジェネレータオブジェクトとして取得します。

サンプルコード・解説記事

from Bio import SeqIO
records = SeqIO.parse('multi_seq.fasta', 'fasta')
for record in records:
    print('------------------------------')
    print(record)

read(handle, format, alphabet=None)

@ [APIドキュメント]

  • 引数
    • handle:ファイル名を表す文字列、もしくはそのテキストストリーム <str / io.TextIOWrapper>
    • format:ファイルフォーマットを表す文字列 <str>
    • alphabet:ファイルからシークエンスタイプを自動で推測できない場合に指定する文字列 <str>
  • 戻り値:
    • ret : handleから読み込まれたSeqRecordオブジェクト <SeqRecord>

単一のシークエンスを表すファイルやテキストストリームをSeqRecordオブジェクトとして読み込みます。複数のシークエンスが含まれる場合は ‘more than one record found in handle’ を返します(この場合はparse関数を用います)。

サンプルコード・解説記事

from Bio import TogoWS, SeqIO
with TogoWS.entry('nucleotide', 'NC_045512.2', 'fasta') as handle:
    record = SeqIO.read(handle, "fasta")

write(sequences, handle, format)

@ [APIドキュメント]

  • 引数
    • sequences : ファイルに保存するSeqRecordオブジェクト、もしくはそのリスト <SeqRecord / list(SeqRecord)>
    • handle : 書き込みを行うファイルオブジェクト、もしくはファイル名 <str>
    • format : ファイルフォーマット <str>
  • 戻り値
    • count : 書き込みを行ったレコード数 <int>

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です