PythonでBLASTする!(BLAST結果のXML解析)【Python】

BLAST検索の結果はテキスト文書、タブ区切り、XML形式など選択できますが、プログラムによる解析を行うのであればXML形式が適しています。ここでは、XML形式で取得したBLAST検索結果の解析方法を説明します。

バイオインフォマティクス環境

以下の方法で構築した環境であることを前提として説明します。

※ 検証はしていませんが、プログラム自体は基本的にmacOS、Linuxでも動作すると思われます。

ここで使用したアプリケーションのバージョンは以下の通りです。

BLAST検索結果の解析方法

ローカルBLASTの結果の取得

コマンド例 (PythonでBLASTする!(ローカルBLASTの実行))で行ったBLAST検索を解析してみます(クエリ配列は変更しています)。まずは、このコマンドをXMLファイルとして結果を取得するように以下のように変更します。なお、あらかじめDBは作成しておく必要があります(コマンド例)。

# クエリ配列を取得します
from Bio import TogoWS, SeqIO
with TogoWS.entry('nucleotide', '1842280863', 'fasta') as handle:
    record = SeqIO.read(handle, "fasta")
    SeqIO.write(record, '1842280863.fasta', 'fasta')

# PCのCPUコア数の取得(並列化処理のため)
import multiprocessing
core = multiprocessing.cpu_count()
 
# ローカルBLASTの実行
from Bio.Blast import Applications
cline = Applications.NcbiblastnCommandline(query='1842280863.fasta', db='Homo_sapiens.GRCh38.dna.toplevel.fa', out='blastn-out.xml', outfmt=5, num_threads=core)
stdout, stderr = cline()

これでBLAST結果をXMLで出力されたBLAST結果を、blastn-out.xmlとして保存しました。この結果を解析するには、以下のようにBio.Blast.NCBIXMLモジュールのread関数を用いて、blastn-out.xmlをBio.Blast.Record.BLastオブジェクトとして取得します。

# 出力ファイルの読み込み
from Bio.Blast import NCBIXML
with open('blastn-out.xml', 'rt') as handle:
    blast_result = NCBIXML.read(handle)

PythonからローカルBLASTを操作する方法は以下の記事をご参照ください。

ウェブ版BLASTの結果の取得 (Pythonから実行する場合)

ウェブ版BLASTの実行 (PythonでBLASTする!(ウェブ版BLASTの実行))で行ったBLAST解析を実行してみます。ウェブ版BLASTでは、qblast関数の戻り値 handle から直接解析を行うことが可能です。

# ウェブ版BLASTから直接結果を読み込む
from Bio.Blast import NCBIWWW, NCBIXML
with NCBIWWW.qblast('blastn', 'nt', '1842280863') as handle:
    record = NCBIXML.read(handle)

Pythonからウェブ版BLASTを操作する方法は以下の記事をご参照ください。

ウェブ版BLASTの結果の取得 (ブラウザから実行する場合)

ブラウザからウェブ版BLASTを実行した場合も、XML形式でダウンロードしたXMLファイルをPythonで解析することが可能です。

まずはウェブ版BLASTにアクセスしてみましょう。

BLASTNのクエリを「1842280863」とし、データベースを「Nucleotide collection (nr/nt)」、プログラムに「blastn」を指定してBLAST検索を実行してみます。

ブラウザからBLAST結果をダウンロードする場合

BLAST結果をXML形式でファイル名blastn-www.xmlとして保存した場合は、以下のようにして読み込みます。

# ダウンロードしたBLAST結果を読み込む
from Bio.Blast import NCBIXML
with open('blastn-www.xml', 'rt') as handle:
    blast_result = NCBIXML.read(handle)

以下の説明では、このblastn-www.xmlから情報を取得する方法を解説していきます。

BLAST結果の構成

BLAST結果をブラウザで表示すると、以下のようにDescription部分とAlignment部分に分かれて表示されます。

PythonのプログラムでBLAST結果を取得する場合も同様で、Bio.Blast.Record.BlastオブジェクトとしてDescription部分(descriptions変数:Descriptionオブジェクトのリスト)とAlignment部分(alignments変数:Alignmentオブジェクトのリスト)に分けて格納されます。

さらに、以下のようにブラウザでGraphic summaryを確認すると、BLAST検索でヒットしたアラインメントを確認できます。

Pythonのプログラムではこのアラインメントが上から順番に0, 1, 2, …と番号が割り振られていて、Bio.Blast.Record.Blastオブジェクトにおいて例えば一番上の「アラインメント0」のDescription部分はdescriptions[0]に、Alignment部分はalignments[0]に格納されます。つまり、Bio.Blast.Record.Blastオブジェクトのdescriptions変数とalignments変数のリストの要素で、同じインデックスのものは対応していることが分かります。

また、アラインメントが複数の断片(High Scoring Pair:HSP)に分かれている場合は、そのdescriptions変数のnum_alignmentsで断片(HSP)の数が格納され、そのalignments変数のhspsにそれぞれの断片(HSP)がリストとして格納されます。

なお、多重配列アラインメントの結果はmultiple_alignment変数に保持されます。

Description部分の取得

先ほどブラウザで実行したBLASTからダウンロードしたblastn-www.xmlを読み込んで、Description部分を取得してみます。なお、ローカルBLASTを用いる場合やPythonでウェブ版BLASTを用いる場合は、BLAST結果ファイルの読み込み部分を適宜読み替えてください。

BLAST結果のDescription部分は、Bio.Blast.Record.Blastオブジェクトのdescriptions変数にDescriptionオブジェクトのリストとして格納されており、含まれる情報はアラインメントのタイトル・スコア値・E-value・HSPの個数です。では、blastn-www.xmlに含まれているDescription部分をアラインメントごとに順番ですべて取得していきましょう。

# BLAST結果ファイルの読み込み
from Bio.Blast import NCBIXML
with open('blastn-www.xml', 'rt') as handle:
    blast_result = NCBIXML.read(handle)

    # Description部分の取得
    descriptions = blast_result.descriptions
    
    for description in descriptions:
        print(description.title)
        print('スコア値(raw):' + str(description.score))
        print('スコア値(bit):' + str(description.bits))
        print('E-value:' + str(description.e))
        print('HSPの個数:' + str(description.num_alignments))
        print('')
gi|1842280863|ref|XM_034560721.1| PREDICTED: Cyclopterus lumpus DLEC1 cilia and flagella associated protein (dlec1), mRNA
スコア値(raw):10066.0
スコア値(bit):9077.64
E-value:0.0
HSP片の個数:1

gi|1784391318|ref|XM_031849788.1| PREDICTED: Anarrhichthys ocellatus DLEC1 cilia and flagella associated protein (dlec1), mRNA
スコア値(raw):7498.0
スコア値(bit):6762.12
E-value:0.0
HSPの個数:1

    ...(以下略)...

Alignment部分の取得

続いて、BLAST結果のAlignment部分を取得してみます。

BLAST結果のAlignment部分は、Bio.Blast.Record.Blastオブジェクトのalignments変数にAlignmentオブジェクトのリストとして格納されています。まずは、blastn-www.xmlに含まれているAlignment部分を順番に取得していきましょう。

from Bio.Blast import NCBIXML
with open('blastn-www.xml', 'rt') as handle:
    blast_result = NCBIXML.read(handle)

    # Alignment部分の取得
    alignments = blast_result.alignments
    for alignment in alignments:
        print(alignment.title)
        print('ID:'  + alignment.hit_id)
        print('説明:' + alignment.hit_def)
        print('配列長:' + str(alignment.length))
        print('HSPの個数:' + str(len(alignment.hsps)))
        print('')
gi|1842280863|ref|XM_034560721.1| PREDICTED: Cyclopterus lumpus DLEC1 cilia and flagella associated protein (dlec1), mRNA
ID:gi|1842280863|ref|XM_034560721.1|
説明:PREDICTED: Cyclopterus lumpus DLEC1 cilia and flagella associated protein (dlec1), mRNA
配列長:5033
HSPの個数:1

gi|1784391318|ref|XM_031849788.1| PREDICTED: Anarrhichthys ocellatus DLEC1 cilia and flagella associated protein (dlec1), mRNA
ID:gi|1784391318|ref|XM_031849788.1|
説明:PREDICTED: Anarrhichthys ocellatus DLEC1 cilia and flagella associated protein (dlec1), mRNA
配列長:5353
HSPの個数:1

    ...(以下略)...

ここで取得されるAlignmentオブジェクトのtitle変数は、対応するDescriptionオブジェクトのtitle変数と同一です。また、このtitle変数は、アラインメントのIDを表すhit_id変数とアラインメントの説明を表すhit_def変数から構成されます。

具体的なアラインメントのHigh Scoring Pair(HSP)はhsps変数にHSPオブジェクトのリストとして格納されています。例えば、上記の結果のうち8番目のアラインメントのHSPを取得してみましょう。

# BLAST結果ファイルの読み込み
from Bio.Blast import NCBIXML
with open('blastn-www.xml', 'rt') as handle:
    blast_result = NCBIXML.read(handle)

    # Description部分の取得
    description = blast_result.descriptions[7]
    print(description.title)
    print('スコア値(bit):' + str(description.bits))
    print('E-value:' + str(description.e))
    print('HSPの個数:' + str(description.num_alignments))
    print('')
    
    # Alignment部分の取得
    alignment = blast_result.alignments[7]
    for hsp in alignment.hsps:
        print('******アラインメント(HSP)******')
        print('スコア値(bit):' + str(hsp.bits))
        print('E-value:' + str(hsp.expect))
        print(hsp.query)
        print(hsp.match)
        print(hsp.sbjct)
        print('')
gi|1832620842|ref|XM_033638402.1| PREDICTED: Epinephelus lanceolatus DLEC1 cilia and flagella associated protein (dlec1), mRNA
スコア値(bit):5323.03
E-value:0.0
HSPの個数:2

******アラインメント(HSP)******
スコア値(bit):5323.03
E-value:0.0
AGTCAATTCAGCCTTTCCCTGGTGTGTGGACCAAGATCTTCTCAAAATGAACAACCTGATTTCCCCCCAGGACTACTTACCTACACACAAACGACCAGTGAGAGCACCAGCACCAATCAAATGGAATCCTGCCAAACCTACCATTGCCTCTGCCATGCACATGTCCAGGGAGCATCAGGATGATGGTTACACTCTCATGCCTAGCCCAAAAAAGATCGTGCCAGAAATGAACGAGTCAGATCTCAGCCTGACCCTCGAATCTAGCTCAGATAACCCAAGGAGGAAGAAAACTTCCAAGGAGAGGCCCGACCAGACCATAACTAGACCAAATGGGAAGGATGAGCCAAGCGCCGAGGATCGGGCAGAGGGACGGAAAAAACTTCCACAGCTGAAAGATCGAAACAACTTCCTATGCAATCCTCGCTTCCTTCCTTTGAATGCACAGCAGGGTGGCGCATCCCTCATCCATCCCAGAGCCAAAGGGGGGAAGATGGAGCATGTAAAGAAAGGGGCGCAGAAGCAAAGCTCAACTAAAAATCCTGTCGCGGCCTTTCTAGCAAAACCTGCAGAGGTAGTTTTCAATGACTACAGTGTGGGACATGTCTATAAGACTACCCTGGAGCTGAAAAACTTGACTTCTGCAAGCCGCACTATCCGAGTCATCCCTCCGACCACTCCTCACTTTTCCATTGGCCTGGGGAGATTCCCTGGCAAGGGTGGTGTTGTTGCCCCAGGGTTGAGTTGTAAGTACACAGTGTGCTTCACTCCAGACTCCTTCGGGGACTATGAGGACTACATAGTGGTGGAGACT---GCTGGACGCCCGTTTATGGTGCCCATCGCAGCCAAAAGACCCGCTCCAATACTCACATTACCAAGAGTTCTGGACTGTGGTTGTTGCCTGATCGGAGGAGTAACATTTGTTGAGTTCCCGTGCCAAAATGTAAGCTTAAGCGCCGGGAGCTTTTGCATCATCCCCAAGAACCAGTGGCCGGCCTCGAACCTCAGGTCTGTGGCAAGAACATACTTTTCTGAGCAGCCACCCTTTGCAGTCAGCCCGTCTCTTTTTGTGCTGCAGCCTGGAGAGGCCACTGTAGTGGAGGTGGTGTTCTTCCCCACTACTGCTGAGAGGAGCTGTCAGGTGTTCACTATTGTGTGTGACAACTGCCAGGTGAAAGACATTTCCATTGAAGGTGAGGGCCAGCAGATTGCATTTGAGCTGGTATCTGTATCTGGGAAGAAGGAGCCTCCTGTGGTGGGAGAGGTGCATGACCTCACTGCGGAGCACTTTGTCCGCTTCAGCCCGTGCAACCCTCACTCTGTGCAACAGAAGAGACTCATCATTAGAAACAATGTCCACTTGGATCTGCCTTTCCACTGGCAGATCATGACGCCGAACCTGCACCCTTTCCTTCCAGGTGAAATCCCGGAGCCTTCCCATATCCAGTTCCACCTGGCCGCAGACGATGTTTTCCATGTCAGCCCCATAACAGGAGTTCTGACCCCCTTCCAGGATCAAGAGTTTCTATTCACCTTCTGCCCTAAAGAATTGAAGGATTACCACAGTGTCTGTCACTTAGTCCTGATGGAGGTTCCCCAGCTGCCACCACAGCCCACTGACAAAAGCGTCCTTCAGCCTGTGCGCACTGGTTCCAAGGTAGGCGATGTCATCGTCATGGAGATAGAGGTCAAGGGATCAACTGAGCCGTACCAGGTCCTACTGGAGCCCTACGCTGTTGTTATCCCCGGGGAGATTTTTATTTGCTCGACCACCCGCAGGCAATTCAAGATGTGGAACCACAGCAAAACCTGCATCTTTTTTCAGTGGGAGAGAATAAGCAACAGCAGCCACATAATTGAAGTAGAGCCCTCTGCTGGTAGCATAGAGGAAAACGAGTGTTTCGACTTCGACCTGGTTTTGAGTGGAGGGAAGCCAGAGAGGGTTGTGACCAGTCTGGTTTGCTCCATAAAGCACTGCCCCGAGCCCGTCACTTTGGCCGTGGAAGTCTCTTTTAAGGGTCCCATAGTGACCGTCAGTGTGCCCAGTGTGGAGTTTGGGCTCATGAAGCTCGGGGAGCAGACACAGACCACTCTGCTCCTCACTAACATTACCCAGCAGGAGGCGAACTGGACACTGAAGGAGAGGTGTGACCGTCAGCAGGACCACCAGGAGATACAGATCTCAGTGGAACCACGCACAGGTGTGCTGTCCCCCTTGGCCTCTTGCAGTGTGGATGTGCTATTTAGTCCCCATTTGTGCCAGCGATATGAAACAGAGCTGGTGTTGACAGTGGAGAATGGAACCGGATGTCACCTGTCGGTGCAAGCAGACGTGCAGTGTCCACAGGTGTGTCTGCTGAACTGTGAGCTGCTCTTCTCTGAACTCTACCTTGGAGTTGCTGCAGAGGGAACCGTCACTATCTTCAACCAGACGCTGCTGCCTTCACACTTCAGCTGGATGGATCAGCTCCAGGGTAAACAGGCTGAACTGTGCTCAGCCAGTTTTGACCCCTCTTCTGGCTCACTGGGACCTAATGCCTGTTTGGAGATCACAGTTCATTTCATCTCTCACACAGATCTGGATCTGACTGAGGTGGCTGCTCTCTGTGAGGTCCAAGGGATGAACTCTCCCCTTGTTGTTGGCATCACGGCTTCCAAAACCAAGAAACTCAGTGTGTCCTACTCACTGCCCAGTGTCTGCTCTCCTCCAGATGACGAGAGACCCTCAACACTGTTGCTCGACTTTTGTGATGACGTCATTTTGAACAGAGCCGTTACTAAGCAGTTATTGATAACCAATCAGACTGCTATCCCGGCCCCTTTCCACATAGAGGCAGATTATTTCACATGCCATGCCTCAAAGCCAAACAACCAGTCAGAGAAAAGAATGACATACGTCAAGAAGCCGCTCCACTATGTTCAAGCTCAGAAAATAGAAGAAAAAGCACTTAAGGAGTTTGTGAGCAGCCTGCTGGCTAATGGAAAAGGTGCAGCTTTCTTTGTCCTGCCAGACACTGGGATGCTGGGAGCCTTTGAGACCCAGACTGTGGATGTCACTGCCTACACGGACATGTGGGGCGAATACAGAGATCACCTCATATGCAAAGTGGGGGACCTCAAGCCCACGCTCATTCCCATGCAGATGACGGTGACAGGCTGCCCACTCTACTTCCAAATCACAGGCCCACGTCCAGACAACCAGAACCAGGGACCAAAAACACAGTTTGGCACTCATGTGTCAGGAGGTGACACGGTGTCTCGTTCTCATCGCATCCACAATCCGACCATGTTTGATATTCGCCTGGACTGGGAAACATATAACATAGATCAGAATGACCATAAACTGGTGGACGTTGTGGTGGCATATGGAGACACCTTTCCAGTTAAAGATGCTGATGGCAACGAGGTGTTAAATGGAGCATTAAGGATTTCTGGTGGGAGTGCTCAAACAGCCTGGGAAGGAAATAAGACCTCAGGTTCTGAGGGGACGAGCTCCCCCCTCTGTAGCATGACCAGTGGGGAAGCAA--AGGAATATGT------------ATCCGAGGAAGAGGAAACCTGTCTCTATCCCTCTCCTGCAAAGAAAAAACTCTTGTCTGTTCACATCAGACCGCATGTGGGCGACCTCTCGGATTACCCATACTGCATCACACCCCAGCAATTAGTGATTCCAGCAAAGAGCAGCAGCACCATCCATGTATCTTTCACTCCTTTGA------CTGGGTCAGGTTGTGAGTCCAGATGTGTGGGCCTGGCTCTGGGCTTCATGGGACTAGACTCTGAGATGGCTGCCTGCGTCCCGGGTAAAGTTGTGAGAGCTCAGGGTTTGGATTTGGAGCCCGTCAGAATTGATCTACTCGCAGTCGTTAAGCCGTCATTGCTGTTGGTGCAGATAGAGGAGGATGAGGGGGTGCTGGAGTTTTATGCCTCAGCCGGTGATTTACTGAAGGCAGAATCA---GAGCTGGTAGTTCGTGAATTTGACACCACACGGGCCTTTCAGCTGAGAAACAACTCAGAAATGCTCCTCCACTTCAGCCTGGGGACTCAGCCTCCCTTTAAGGTGGTGAAGCAGCAGCTTGAAGTCCGGACCAGCAGCTCCAGCGACCCACCTACTGGTGACAGCCAGGCTCTGGTGCTGCACCCACAGCAAAGCATGCAGGTGAAGGTGGCCTTCCACTGCTCCCTGCCCCTTCTGGACCATGCAGACCAGGCAGAGGAGGAAGTCCCTCCGGGGGTGACGCTGATCCATCGTGCAGGAGAGGGAAGGAAGCTGAGGTTCCAGCAAAACCTCCTGATTCACTACAACGACAACAGATTGCAGACGGTGCCTCTCTGTGCCTGTTTATATCTCCCTACGATGCGTCTGTCCAGGGACAGCATCGACTTTGGGTTCTGCTTCGTGGGGCAGACGCTGATAACAGAAGTCAACCTCCACAGAAACAGAGCCCTCACTTACTGGAAATCAGTTATTGAGTCGGATGAAGGAGACTCCCATGTGTTCAGAGTCACACCAGACTTCGGGCTCCTCAGGTCAAAGGAGCTTAACGTCACCAGCTGCAGCCACTGTCTCCAGATCAGCTTTACTCCCAGTGAGGACGGAGTGTTCAGGGCCGTTGTGGTAATCCAGTCCCCTCTGATGAAGACCCCCCCCACTCTGCAGCTCCAGGGAACCGGATCCTTTGACAAAGTGTACAGGTCCAACTCGATGTCCTTAAAACATCACAGTCGCACA---ATCAC---------CACCTGTTCTCCTTAAATCAACT-TGT-----TCATTTA--GGAATGTAAATAAATATG
|||| | | ||||||| ||||||||| ||||    | |||||| |||||||||||||||||||||| ||||||||| ||||| |||| |||| ||  |||| |||||||||||| || |||| |||||||| || ||| ||||| ||||  ||  ||||| |||||||||||| |||||||||||||||   ||| ||||| |||||  |||||||  | || |||||||| |||||||||| |||||||||  |  |||| |||||||||| ||||| ||||||||||||  ||||||||| ||   ||||||||| | | ||||||||  ||||||||||||  |||||  ||||||||||||||||| || || ||||||    ||| ||||||||| ||| ||||||| ||||||||||||||||||||   | ||| |||||||||||| ||||||||||||| ||||||||||||| ||||||||  | |||||| | || ||||  | || |||| ||||  ||| |  ||   ||| | | ||| || ||||||||  ||| ||| ||||||| ||||||||||||||||||||| ||| |||| || |||||||||||||| ||||||||||||||||||||| | || ||||||||||| ||||||||| |||| |  |||||||||||||| || ||| |  |||| || ||||| ||||||||| |||| ||||||||| ||||| ||||  ||||||||||| | |||||||||||||||| ||||||||| ||| |    |||| || || | || |||| | ||||||||||| | ||||| |||||||||||||||||||||||||||||||||||||||  || ||||| ||||| ||||  ||||| ||| ||| ||||||||||||  || | ||| |||||| ||| ||||||||||| |||||||||||||| | ||||||||||||||||||||||||||| | ||||||||||||||| |||||||||||||||||||||||||||||||||||||| |||||||||| |||  |||||||||| ||||||||||| ||||| |||| ||||||||||||||||||| | ||||||||||||||||||||||||||||||||||| |||||||||||||||| ||| ||| ||||||| || |||||||| |||||||| |||||||| |||||||||||||| || ||||||||||| ||||||||||| || ||||||||||| ||||||||||||||||| | ||| | | |||||||||| ||||||||||||||||| ||||||||||||||||||||||||  ||| ||| |||||||| | |||||||| |||| ||| ||||| ||| ||||||||| |||||||||| |||||||||||||||| ||||||||  ||||||| |||||  | ||||   |||| || |||||||| ||||| ||||| || ||||| ||||||||||||||||||||||||||||||||||||| ||| || ||| ||||||||||  |||| | |||||  || ||||||||||||||||||||||| ||||| ||| |||||||||  || |||| |||||| |||||||| ||||| |||||||||||||||||||||||||||||| ||||| | ||||| || ||||||||||||||| | ||||| ||||||| ||||||||||||||||||||||| ||||  |||||| ||||| ||||||||||| |||| |||||||||||| || ||||||||||||||||||||||  |||||||| |||||||| || |||||||||||| |||||| ||||||||| |||||||| ||||||||||| ||||| |||  |||| |||||  ||  ||||||||||||||| || |||||||||||||||||||||||| ||||||| |||||||||||| | |||||||||||||| | |  ||| ||||||||||||||||||| |||| |||||||||||| ||||||| ||||||   ||||||||||| |||||||  | |  |||||||||||           ||||||||||||||| ||| ||| |||||||||| | || |||||||| |||| |||||||||| |||||| ||||| ||| ||||||||||||||||||||||||| ||||||||||||||||||||| ||||||||| |||| |||| |||||| || |||| ||| |||||||| ||||||||||||||||||||| ||||||| ||||   |||||||| ||||  ||| | || ||||| |||||||| |||| |  ||||||||||||||||||||||||| ||||||||||||||||||||||||||||||  ||||||||||||||||||| |||||| | ||||||||| ||||| | |||||||||||||||   || ||  |||||||||| ||||| |||||||||||||||||||||||||||||||| |||||||||||||| ||||||||| |||||  | |||| | ||||||||  |||||||||  ||||||||||||||||||||||||| |  | || |  ||||   ||||||||| ||| || |||||| | ||||||||||||||||| ||||| || |||||||||||| ||||||||||||| || |||||||| || ||||||   |||||||  || |||||||| |||  ||||||||||||||| |||||||||||||||||| | |||||||||| |||||| || | ||  ||||||||  ||||| ||||||||||||||| | | |||||||||||||||||||||||| ||||||||||||||||||||||||||||||||||  |||||| ||||||| | ||||||||||||||||||||||| ||||||||||| ||||||||||| |||||||||||||| |||||||||||||| || |||||  |||||||||||||||||||||||||||| ||||||||||||||||||||||||||||| | |||||||||||||||  ||||||||||||||||    | || ||||||| |||||||||| |||||||| || ||||||| ||||  ||||||| |||| || |||||||||||||||||||||||||||||||| |||||||||||||  ||||||  |||||||||||| ||||||||||| |||||||||||||||||||||||||||||||||||  | ||  | || |  ||||| |||||||||||||||||||    |||||||||||||||| ||||| ||||| |  | ||  |||| ||||||  | ||||| | ||  |||| | ||||||  |||  ||||||||||             |  ||||||||||||| |||||| ||||||| |||| |||||||||||||| | ||||| ||||| | ||| |||| |||| |||||||||||||||||||||||||||||||||||||| |||| |||||||||||||||||||||||||||||||| |||||||| |||||||      ||| ||||| ||||||||||||||||||||||||||||| |||||||||| | |||||||| |||||||||||||| ||||||||||||||||  |||||||||||||||||||||||||| ||||| || |||||||||||||| ||||||||  || ||||||| |||||||| |||||||| |||||||||||||||||| ||||||| |||||||||||||||| ||||||||||    ||||   ||||| ||||||||||| ||||||| || |||||||||| ||||||| |||||||| |||  ||||||| |||||||||||| |||| |||   ||| | |||| ||||| |  || ||| ||||||| ||||||| |||| ||| |||||||| ||||| ||||||||||||| ||||| || ||| ||||||||||||||||||||| |||||||||| | |||||||||||||||||||||||||| || ||  ||||| | |||||||||||||| ||| || ||  || || ||||||||||||||||||||||||||| || |||||||||| | | ||||   ||||||||||||| ||||| ||   |||   ||| ||||| |||  ||| ||||  |||||||||  |||||||||||| |  ||||| ||||| | ||||| |||||| |||||| ||||  || |||||| |||  |||||||||||||||  ||||| ||| ||||||||||||||||||||||||| |||||||| |||||||||||||  |  | ||||||  | |||| ||||| ||| || ||||||||||||||||| ||||||||||||||| ||| ||||||||||  |||||| |||||||| |||||| |||||||| ||  ||||||||||||||||||||| |||||||||||  ||| ||||||||||||||   | |||||| |||||||||||| ||||   | |||         |||||| |||| ||||||||| | |||     |||||||   |||||||||||||||||
AGTCGAATTAGCCTTTTCCTGGTGTGAGGACAGCAACCTTCTCCAAATGAACAACCTGATTTCCCCTCAGGACTACCTACCTTCACAAAAACCACGTGTGAAAGCACCAGCACCGATAAAATTGAATCCTGGCAGACCCACCATCGCCTACGCTTTGCACGTGTCCAGGGAGCCTCAGGATGATGGTTATGGTCTAATGCCCAGCCCTGAAAAGATAATCCCCGAAATGAATGAGTCAGATCGCAGCCTGACGTTTAAATCCAGCTCAGATACCCCAAAGAGGAAGAAAACCCCCAAGGAGACGCGGAACCAGACCAAACCCAGACCAAAGTGGAAGGATGAGCTGAGCGCAAAGGATCGGGCAGAGGGATGGGAACAACTTCAGAGGCTTAAAGATCGACACAGCTTCCTACGCAATCCTCGCTTCCTTCCTCCAAGTGCGCAGCAGGGTGGCACATCCCTCATCCAGCCCAGAGCCAAAGCGGGGAAGACAGGGCATGTGAGGAGAGGGATGGAGGAGCACAGCTTCACTGATGATGTGGTCCCAGTCTTCCTTGCAAAACCCCCAGTGGTGGTTTTCACTGACTACAGTGTGGGACATGTTTATGAGACGACACTGGAGCTGAAAAATTTGACTTCTGCAAGCCGCACTGTTCGGGTCATCCCTCCTACCACTCCTTACTTCTTTATTGGCCTGGGGAGGTTTCCTAGTGAGGGCGGCGTTGTCGCCCCAGGGATGAGCTGTAAGTACTCAGTGCGCTTTGCTCCAGACTCCCTGGGGGACTATGAGGACTTCATAGTGGTAGAGGCCCAGGCTGAACACCTGCTTGTGGTACGCATCGCAGCCAGACGACCCCCTCCAATACTCACATTACCAAGAGTTCTGGACTGTGGTTTCTGTCTGATTGGAGGGGTAAAGTTTGTGGAGCTCCTGTGCCAAAATGTCGGCCTCAGCACCGGGACCTTCTGCATCATCCCTAAGAACCAGTGGCCAGTCTCGAACCTCAGGTCTGTGGCAAGAACTTTCTTTTCTGAGCAGCCGCCCTTTGCAGTCAGCCCGTCTCTTTTTGTGCTGCAGCCAGGAGAGGCCATTGTGATGGAGGTGGTTTTCTTCCCCACCACTGCGGAGAAGAGCTGTCAGGTGTTCACTGTGGTGTGTGACAACTGCCAGGTGAAAGACATTTCCATAGAAGGTGAGGGCCAGCTGATAGCACTTGAGCTTGTGTCTGTATCAGGGAAGAAAGAGCCTCCAGTGGTGGGAGAGGTTCACGACCTCACTGCAGAGCACTTTGTGCGTTTCAGCCCGTGTAACCCTCACTCTGTGCAGCGGAAAAAAGTCATCATTAGGAACAATGTCCACTTGGAGCTGCCTTTCCACTGGCAGATCATGGAGCCAAACTTGCACCCTCTGCTTCCAGGGGAAACCCCCGAGCCCTCCTATATCCAGTCCCACCTGGCCACAGACGATGTTTTCCAAGTCAGCCCTTTAACAGGTGTTCTCCCACCCTGTGAGGAACAGGAGTTTCTGTTCACATTCTGTCCCAAAGAGTTGAAGGATTACCACAGTGTCTGTCACTTAGTCCTGAGGGACGTCCCCGAGCTGCCACCCGAGCCTAGTGACAGCAGTGTCCTTCAGCCTGTGCGCACTGGCTCCAAAGTAAGCGATGTCACTGTAATGGGGATAGAAGTCAAGGGGTCAACAGAGCCGTACCAGGTCCTACTGGAGCCCTACACTGTTTTGATCCCTGGAGAGATTTTTATTTGCACAACCACACGCAGGCGATTCAAGATGTGGAACCACAGCAGAACCCACATCTTCTTTCACTGGGAGAGAATGAGCAGCAGCAGCCACATCATAGAAGTAGAGCCCTCTGCTGGTACAATAGAGGAGAACGAGTGCTTTGACTTCGACCTGATTTTGAATGGAGGGAAACCAGAGAGAGTTGTGACCAGCCTGGTCTGCCACATAGAGCACCACCATGAGCCCGTCACTTTGCCCCTGGAAGTCTCTTTTAAGGGTCCCACAGTGACCCTCAGTGTGCCCATTTTGGAGTTTGGGCTCGTTAGACTCAGGGAGCAGACACAGACCACGCTGCACCTCACTAACATCACCCAGCTGGAGGCCTGCTGGACACTGATGGAGAGGCATAATAGTCAGCAGGAC---------TCACAGATCTCAGTGGAGCCATGCAGAGGTGTGCTGCCTCCTTTGGCCTCGTGCACTGTGGATGTGATATTTACTCCCCGTTTCTGCCAGCGATATGAAACAGAGCTGGAGTTGACAGTGGAGAATGGAACAGGATGTCACTTGTCAGTGCGAGCAGATGTACAGTCTCCTCAGGTGTGCCTGCTGAACTGTGAGCTGCTCCTCTCTGATCTCTTTGTTGGAGTTCCTGCCAAGGCAGCCATCACTCTCTTCAACAAGACCCCCCTGCCTTCACACTTCAGCTGGATGGCTCAGCTCCAGGGTAAACAGGCTGAACTGTGTACAGCCAGTTTTGACCCCTCATCTGGCACTCTGGGACCTCATGCCAGGTTGGAGATCACAGTTAGCTTTATTGCTCACACAGACCTGGAGCTGACTGAGGTGGCTGCTCTCTGTGAGGTCCAGGGGATGAACTCTCCTCTTGTTGTTAGCATCGTGACTTCTAGAACCAAGACGCTCAGTGTGGTCTACTCACTGCCCAGTGTCTGCTCTACCACGGACGGTGAGACCACCTCAACACCGTTACTTGACTTTGGAGATGACGTCATTTTGAAGAGAGCTGTCACTAAGCAGTTACTGATAACCAATCAAACAGCTATCCCTGCTCCTTTCACAATAGAGGTGGAGTATTTCACCTGCTGTGCCTCAAAGCCAAATAACCAGTCAGAGAAAAGATTCACATACGTCAGGAAGCCACTTCTCTTGGTTCAAGCAAAGAAAGTAGAAGAAAAAGCACATGAAGAGTTTGTGAGCAGCCTGCTGGCTCATGGAAAAGGTGCAGCTTTCTTTGTCCTGCCAGATTCTGGGACGCTGGGACCTTTTGAGACCCAGACTGTGGATGTTACTGCCTACACTGACATGTGGGGGGAATACAGAGATCATCTCATATGCAAAGTTGGAGACCTTGAGCCCACGCTCATTCCCATGCAGATGACAGTGACAGGCTGCCCACTCTACTTCCAAATGATAGGCCCACGTCCAGATGACCAGAACCAGGGACCTGTCATACGGTTTGGCGCTCATGTGTCTGGAGGTGATACAGTGTCTCATTCTGTTCGCATCAACAACCCCACCATGTTTGATATTCGCCTGGACTGGGAAACGTATAACATAGATCCCAATGACGGTAAACTGGTGGATGTTGTGGTGGCGTATGGAGACACCTTTCCAGTTAAAGATGCTGATGGTGATGAAATATTGAGCGGAGCGTTAAGGATTTCTGGTGGGAACCTTCAAACAGCCTGGGAAAGAAATGAGACCCCGAGCTCCAAGGGAACGAGCGACTCCCTCCGAAGTGTGACTAATGGGGA--CAAGGAGGAATATGTGTGTGAGGATGACTGTGAGGAAGAGGAAAGCTGTCTTTATCCCTTTCCTTCAAAGAAAAAACTCATTTCTGTCCACATTACACCTCATGCGGGCAACCTCTCGGATTACCCATACTGCATCACACCCCAGCAAATAGTAATTCCAGCAAAGAGCAGCAGCACCATCCATGTTTCTTTCACCCCTTTGACCCTTTCTGAGTCAGCTTGTGAGTCCAGATGTGTGGGCCTGGCTCGGGGCTTCATGAGTCTAGACTCCGAGATGGCTGCCTGTGTCCCGGGTAAAGTTGGAAGAGCTCAGGGTTTGGATTTGGAGCCTGTCAGGATGGATCTACTCGCAGTTGTTAAGCCTGCAGTGCTGTTAGTGCAGATGGAGGAGGACGAGGGGGTGCTGGAGTTTCATGCCTCTGCCGGTGATTTACTGAGGGCAGAATCACAGAAGCTCAGAGTTCATGAATTTGACATCACACGGTCCCTTCAGCTGAGGAACAACTTAGAAATGCCCCTATACTTCAGACTGGGGACTCAGACTCCATTTTTAGTGCTCAAGCCGCAGCCTCGAGCCCGAACCAGCATCTCCAGCAACCCGCCTTCTGGTGACGGCCAGCCTCTGGTGCTGCAACCACAACACAGCGTGCAGGTGAAGGTGGCCTTCCGCTGCTCCCTGTCTCTTCTGGACCATGCAGACCAGGCAGACGAAGACATCCCTTCTGGGGTGACGCTGATTCATGGTACAAAAGGGGAAAGGAAGCTGAGGTTCCAGCAAAACCTGCTAATTCACTACAGCAAAAACACCCTGCAGACGGTGCCACTCTGCGCTCATTTGGCTCTTCCTACAATGAATCTATCCAAAGACAGCATCAGCTTTGGGTTCTGTTATGTGGGACAGACACAGATAAGAGAAGTGAACCTCTACAGCCACGGAGCCCACACACACTGGAAATCAGTTACAGAGTCAGATAAAGGAGACTCCCATGTGTTCAGAGTGACACCAGATTTCGGGCTCCTCAAATTGAGGGAGCTCCATGTCAGCAGCTACAGTCAGTGTCTCCAGATCAGCTTCACTCCCAGTGAGGACAGAGAGTTCAGGGCCACTGTGGTGATCCAGTCTCCTCTGGTGAAGACCTCCGTCACTCTGCAGCTCCAGGGAACAGGATCCTTTGATGAAGGGTACAGGTCCAACTAACTATCCTTATAACATCACAGTCACACAGTGAACACCTGCTGTTTCACCTGCTCTCTTTAAATCAATTGTGTTCAAGTCATTTATGAGAATGTAAATAAATATG

******アラインメント(HSP)******
スコア値(bit):178.918
E-value:3.73446e-39
ATGGGGAAAGACACTTTGTCCAACCTCATAAAGACAAAGACTGGCCAAGGCGGCTTCCATGACAGATATGTCGAGGAGCTCCAGCAGGCTCATTCTGAGTACAACCGGTCTATAAAACAGGCGGACATGCTGGAGAGTCACATCATTCAGGCCAGAGATCGGGCCGCGGCCATAGA
|| ||||||||||||| ||||||| || | |||||||||| ||| | | || ||| ||||||||||||||| |||||||| || |||||||||||||| |||| ||||| ||||||| |||| |||||||||||   |||  | ||| ||||||||| |||||| || | || |||
ATCGGGAAAGACACTTCGTCCAACTTCTTCAAGACAAAGAATGGACGAAGCAGCTACCATGACAGATATGTTGAGGAGCTTCAACAGGCTCATTCTGAATACAGCCGGTGTATAAAAGAGGCTGACATGCTGGAAGCTCATTTAATTGAGGCCAGAGCTCGGGCTGCAGACACAGA

関連記事・スポンサーリンク

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です