Bio.SeqIO モジュール
[APIドキュメント] [toc]
目次
サブモジュール
※ Bio.SeqIO パッケージに含まれるサブモジュール
関数
convert(in_file, in_format, out_file, out_format, alphabet=None)
- 引数
- in_file:入力ファイルのファイル名 <str>
- in_format:入力ファイルのフォーマット(小文字で指定) <str>
- out_file:出力ファイルのファイル名 <str>
- out_format:出力ファイルのフォーマット(小文字で指定) <str>
- alphabet
- 戻り値:レコード数 <int>
シークエンスファイルのフォーマットを変換します。戻り値は含まれているレコード数です。
parse(handle, format, alphabet=None)
- 引数
- handle:ファイル名を表す文字列、もしくはそのテキストストリーム <str / io.TextIOWrapper>
- format:ファイルフォーマットを表す文字列 <str>
- alphabet:ファイルからシークエンスタイプを自動で推測できない場合に指定する文字列 <str>
- 戻り値:
- ret : handleから読み込まれたSeqRecordオブジェクトのジェネレータオブジェクト <generator(SeqRecord)>
ファイルやテキストストリームに含まれるシークエンスを、1つ1つのシークエンスごとにSeqRecordオブジェクトに変換し、それをまとめたジェネレータオブジェクトとして取得します。
サンプルコード・解説記事
from Bio import SeqIO
records = SeqIO.parse('multi_seq.fasta', 'fasta')
for record in records:
print('------------------------------')
print(record)
read(handle, format, alphabet=None)
- 引数
- handle:ファイル名を表す文字列、もしくはそのテキストストリーム <str / io.TextIOWrapper>
- format:ファイルフォーマットを表す文字列 <str>
- alphabet:ファイルからシークエンスタイプを自動で推測できない場合に指定する文字列 <str>
- 戻り値:
- ret : handleから読み込まれたSeqRecordオブジェクト <SeqRecord>
単一のシークエンスを表すファイルやテキストストリームをSeqRecordオブジェクトとして読み込みます。複数のシークエンスが含まれる場合は ‘more than one record found in handle’ を返します(この場合はparse関数を用います)。
サンプルコード・解説記事
from Bio import TogoWS, SeqIO
with TogoWS.entry('nucleotide', 'NC_045512.2', 'fasta') as handle:
record = SeqIO.read(handle, "fasta")
write(sequences, handle, format)
- 引数
- sequences : ファイルに保存するSeqRecordオブジェクト、もしくはそのリスト <SeqRecord / list(SeqRecord)>
- handle : 書き込みを行うファイルオブジェクト、もしくはファイル名 <str>
- format : ファイルフォーマット <str>
- 戻り値
- count : 書き込みを行ったレコード数 <int>
コメント