BLAST検索の結果はテキスト文書、タブ区切り、XML形式など選択できますが、プログラムによる解析を行うのであればXML形式が適しています。ここでは、XML形式で取得したBLAST検索結果の解析方法を説明します。
バイオインフォマティクス環境
以下の方法で構築した環境であることを前提として説明します。
- Windows10 + WSL (WindowsユーザーのためのPythonを用いたゲノム解析環境)
※ 検証はしていませんが、プログラム自体は基本的にmacOS、Linuxでも動作すると思われます。
ここで使用したアプリケーションのバージョンは以下の通りです。
- Python 3.7.6
- Biopython 1.76 → Biopythonについて
- BLAST 2.10.0+
BLAST検索結果の解析方法
ローカルBLASTの結果の取得
コマンド例 (PythonでBLASTする!(ローカルBLASTの実行))で行ったBLAST検索を解析してみます(クエリ配列は変更しています)。まずは、このコマンドをXMLファイルとして結果を取得するように以下のように変更します。なお、あらかじめDBは作成しておく必要があります(コマンド例)。
# クエリ配列を取得します
from Bio import TogoWS, SeqIO
with TogoWS.entry('nucleotide', '1842280863', 'fasta') as handle:
record = SeqIO.read(handle, "fasta")
SeqIO.write(record, '1842280863.fasta', 'fasta')
# PCのCPUコア数の取得(並列化処理のため)
import multiprocessing
core = multiprocessing.cpu_count()
# ローカルBLASTの実行
from Bio.Blast import Applications
cline = Applications.NcbiblastnCommandline(query='1842280863.fasta', db='Homo_sapiens.GRCh38.dna.toplevel.fa', out='blastn-out.xml', outfmt=5, num_threads=core)
stdout, stderr = cline()
これでBLAST結果をXMLで出力されたBLAST結果を、blastn-out.xmlとして保存しました。この結果を解析するには、以下のようにBio.Blast.NCBIXMLモジュールのread関数を用いて、blastn-out.xmlをBio.Blast.Record.BLastオブジェクトとして取得します。
# 出力ファイルの読み込み
from Bio.Blast import NCBIXML
with open('blastn-out.xml', 'rt') as handle:
blast_result = NCBIXML.read(handle)
PythonからローカルBLASTを操作する方法は以下の記事をご参照ください。
ウェブ版BLASTの結果の取得 (Pythonから実行する場合)
ウェブ版BLASTの実行 (PythonでBLASTする!(ウェブ版BLASTの実行))で行ったBLAST解析を実行してみます。ウェブ版BLASTでは、qblast関数の戻り値 handle から直接解析を行うことが可能です。
# ウェブ版BLASTから直接結果を読み込む
from Bio.Blast import NCBIWWW, NCBIXML
with NCBIWWW.qblast('blastn', 'nt', '1842280863') as handle:
record = NCBIXML.read(handle)
Pythonからウェブ版BLASTを操作する方法は以下の記事をご参照ください。
ウェブ版BLASTの結果の取得 (ブラウザから実行する場合)
ブラウザからウェブ版BLASTを実行した場合も、XML形式でダウンロードしたXMLファイルをPythonで解析することが可能です。
まずはウェブ版BLASTにアクセスしてみましょう。
BLASTNのクエリを「1842280863」とし、データベースを「Nucleotide collection (nr/nt)」、プログラムに「blastn」を指定してBLAST検索を実行してみます。
BLAST結果をXML形式でファイル名blastn-www.xmlとして保存した場合は、以下のようにして読み込みます。
# ダウンロードしたBLAST結果を読み込む
from Bio.Blast import NCBIXML
with open('blastn-www.xml', 'rt') as handle:
blast_result = NCBIXML.read(handle)
以下の説明では、このblastn-www.xmlから情報を取得する方法を解説していきます。
BLAST結果の構成
BLAST結果をブラウザで表示すると、以下のようにDescription部分とAlignment部分に分かれて表示されます。
PythonのプログラムでBLAST結果を取得する場合も同様で、Bio.Blast.Record.BlastオブジェクトとしてDescription部分(descriptions変数:Descriptionオブジェクトのリスト)とAlignment部分(alignments変数:Alignmentオブジェクトのリスト)に分けて格納されます。
さらに、以下のようにブラウザでGraphic summaryを確認すると、BLAST検索でヒットしたアラインメントを確認できます。
Pythonのプログラムではこのアラインメントが上から順番に0, 1, 2, …と番号が割り振られていて、Bio.Blast.Record.Blastオブジェクトにおいて例えば一番上の「アラインメント0」のDescription部分はdescriptions[0]に、Alignment部分はalignments[0]に格納されます。つまり、Bio.Blast.Record.Blastオブジェクトのdescriptions変数とalignments変数のリストの要素で、同じインデックスのものは対応していることが分かります。
また、アラインメントが複数の断片(High Scoring Pair:HSP)に分かれている場合は、そのdescriptions変数のnum_alignmentsで断片(HSP)の数が格納され、そのalignments変数のhspsにそれぞれの断片(HSP)がリストとして格納されます。
なお、多重配列アラインメントの結果はmultiple_alignment変数に保持されます。
Description部分の取得
先ほどブラウザで実行したBLASTからダウンロードしたblastn-www.xmlを読み込んで、Description部分を取得してみます。なお、ローカルBLASTを用いる場合やPythonでウェブ版BLASTを用いる場合は、BLAST結果ファイルの読み込み部分を適宜読み替えてください。
BLAST結果のDescription部分は、Bio.Blast.Record.Blastオブジェクトのdescriptions変数にDescriptionオブジェクトのリストとして格納されており、含まれる情報はアラインメントのタイトル・スコア値・E-value・HSPの個数です。では、blastn-www.xmlに含まれているDescription部分をアラインメントごとに順番ですべて取得していきましょう。
# BLAST結果ファイルの読み込み
from Bio.Blast import NCBIXML
with open('blastn-www.xml', 'rt') as handle:
blast_result = NCBIXML.read(handle)
# Description部分の取得
descriptions = blast_result.descriptions
for description in descriptions:
print(description.title)
print('スコア値(raw):' + str(description.score))
print('スコア値(bit):' + str(description.bits))
print('E-value:' + str(description.e))
print('HSPの個数:' + str(description.num_alignments))
print('')
gi|1842280863|ref|XM_034560721.1| PREDICTED: Cyclopterus lumpus DLEC1 cilia and flagella associated protein (dlec1), mRNA スコア値(raw):10066.0 スコア値(bit):9077.64 E-value:0.0 HSP片の個数:1 gi|1784391318|ref|XM_031849788.1| PREDICTED: Anarrhichthys ocellatus DLEC1 cilia and flagella associated protein (dlec1), mRNA スコア値(raw):7498.0 スコア値(bit):6762.12 E-value:0.0 HSPの個数:1 ...(以下略)...
Alignment部分の取得
続いて、BLAST結果のAlignment部分を取得してみます。
BLAST結果のAlignment部分は、Bio.Blast.Record.Blastオブジェクトのalignments変数にAlignmentオブジェクトのリストとして格納されています。まずは、blastn-www.xmlに含まれているAlignment部分を順番に取得していきましょう。
from Bio.Blast import NCBIXML
with open('blastn-www.xml', 'rt') as handle:
blast_result = NCBIXML.read(handle)
# Alignment部分の取得
alignments = blast_result.alignments
for alignment in alignments:
print(alignment.title)
print('ID:' + alignment.hit_id)
print('説明:' + alignment.hit_def)
print('配列長:' + str(alignment.length))
print('HSPの個数:' + str(len(alignment.hsps)))
print('')
gi|1842280863|ref|XM_034560721.1| PREDICTED: Cyclopterus lumpus DLEC1 cilia and flagella associated protein (dlec1), mRNA ID:gi|1842280863|ref|XM_034560721.1| 説明:PREDICTED: Cyclopterus lumpus DLEC1 cilia and flagella associated protein (dlec1), mRNA 配列長:5033 HSPの個数:1 gi|1784391318|ref|XM_031849788.1| PREDICTED: Anarrhichthys ocellatus DLEC1 cilia and flagella associated protein (dlec1), mRNA ID:gi|1784391318|ref|XM_031849788.1| 説明:PREDICTED: Anarrhichthys ocellatus DLEC1 cilia and flagella associated protein (dlec1), mRNA 配列長:5353 HSPの個数:1 ...(以下略)...
ここで取得されるAlignmentオブジェクトのtitle変数は、対応するDescriptionオブジェクトのtitle変数と同一です。また、このtitle変数は、アラインメントのIDを表すhit_id変数とアラインメントの説明を表すhit_def変数から構成されます。
具体的なアラインメントのHigh Scoring Pair(HSP)はhsps変数にHSPオブジェクトのリストとして格納されています。例えば、上記の結果のうち8番目のアラインメントのHSPを取得してみましょう。
# BLAST結果ファイルの読み込み
from Bio.Blast import NCBIXML
with open('blastn-www.xml', 'rt') as handle:
blast_result = NCBIXML.read(handle)
# Description部分の取得
description = blast_result.descriptions[7]
print(description.title)
print('スコア値(bit):' + str(description.bits))
print('E-value:' + str(description.e))
print('HSPの個数:' + str(description.num_alignments))
print('')
# Alignment部分の取得
alignment = blast_result.alignments[7]
for hsp in alignment.hsps:
print('******アラインメント(HSP)******')
print('スコア値(bit):' + str(hsp.bits))
print('E-value:' + str(hsp.expect))
print(hsp.query)
print(hsp.match)
print(hsp.sbjct)
print('')
gi|1832620842|ref|XM_033638402.1| PREDICTED: Epinephelus lanceolatus DLEC1 cilia and flagella associated protein (dlec1), mRNA スコア値(bit):5323.03 E-value:0.0 HSPの個数:2 ******アラインメント(HSP)****** スコア値(bit):5323.03 E-value:0.0 AGTCAATTCAGCCTTTCCCTGGTGTGTGGACCAAGATCTTCTCAAAATGAACAACCTGATTTCCCCCCAGGACTACTTACCTACACACAAACGACCAGTGAGAGCACCAGCACCAATCAAATGGAATCCTGCCAAACCTACCATTGCCTCTGCCATGCACATGTCCAGGGAGCATCAGGATGATGGTTACACTCTCATGCCTAGCCCAAAAAAGATCGTGCCAGAAATGAACGAGTCAGATCTCAGCCTGACCCTCGAATCTAGCTCAGATAACCCAAGGAGGAAGAAAACTTCCAAGGAGAGGCCCGACCAGACCATAACTAGACCAAATGGGAAGGATGAGCCAAGCGCCGAGGATCGGGCAGAGGGACGGAAAAAACTTCCACAGCTGAAAGATCGAAACAACTTCCTATGCAATCCTCGCTTCCTTCCTTTGAATGCACAGCAGGGTGGCGCATCCCTCATCCATCCCAGAGCCAAAGGGGGGAAGATGGAGCATGTAAAGAAAGGGGCGCAGAAGCAAAGCTCAACTAAAAATCCTGTCGCGGCCTTTCTAGCAAAACCTGCAGAGGTAGTTTTCAATGACTACAGTGTGGGACATGTCTATAAGACTACCCTGGAGCTGAAAAACTTGACTTCTGCAAGCCGCACTATCCGAGTCATCCCTCCGACCACTCCTCACTTTTCCATTGGCCTGGGGAGATTCCCTGGCAAGGGTGGTGTTGTTGCCCCAGGGTTGAGTTGTAAGTACACAGTGTGCTTCACTCCAGACTCCTTCGGGGACTATGAGGACTACATAGTGGTGGAGACT---GCTGGACGCCCGTTTATGGTGCCCATCGCAGCCAAAAGACCCGCTCCAATACTCACATTACCAAGAGTTCTGGACTGTGGTTGTTGCCTGATCGGAGGAGTAACATTTGTTGAGTTCCCGTGCCAAAATGTAAGCTTAAGCGCCGGGAGCTTTTGCATCATCCCCAAGAACCAGTGGCCGGCCTCGAACCTCAGGTCTGTGGCAAGAACATACTTTTCTGAGCAGCCACCCTTTGCAGTCAGCCCGTCTCTTTTTGTGCTGCAGCCTGGAGAGGCCACTGTAGTGGAGGTGGTGTTCTTCCCCACTACTGCTGAGAGGAGCTGTCAGGTGTTCACTATTGTGTGTGACAACTGCCAGGTGAAAGACATTTCCATTGAAGGTGAGGGCCAGCAGATTGCATTTGAGCTGGTATCTGTATCTGGGAAGAAGGAGCCTCCTGTGGTGGGAGAGGTGCATGACCTCACTGCGGAGCACTTTGTCCGCTTCAGCCCGTGCAACCCTCACTCTGTGCAACAGAAGAGACTCATCATTAGAAACAATGTCCACTTGGATCTGCCTTTCCACTGGCAGATCATGACGCCGAACCTGCACCCTTTCCTTCCAGGTGAAATCCCGGAGCCTTCCCATATCCAGTTCCACCTGGCCGCAGACGATGTTTTCCATGTCAGCCCCATAACAGGAGTTCTGACCCCCTTCCAGGATCAAGAGTTTCTATTCACCTTCTGCCCTAAAGAATTGAAGGATTACCACAGTGTCTGTCACTTAGTCCTGATGGAGGTTCCCCAGCTGCCACCACAGCCCACTGACAAAAGCGTCCTTCAGCCTGTGCGCACTGGTTCCAAGGTAGGCGATGTCATCGTCATGGAGATAGAGGTCAAGGGATCAACTGAGCCGTACCAGGTCCTACTGGAGCCCTACGCTGTTGTTATCCCCGGGGAGATTTTTATTTGCTCGACCACCCGCAGGCAATTCAAGATGTGGAACCACAGCAAAACCTGCATCTTTTTTCAGTGGGAGAGAATAAGCAACAGCAGCCACATAATTGAAGTAGAGCCCTCTGCTGGTAGCATAGAGGAAAACGAGTGTTTCGACTTCGACCTGGTTTTGAGTGGAGGGAAGCCAGAGAGGGTTGTGACCAGTCTGGTTTGCTCCATAAAGCACTGCCCCGAGCCCGTCACTTTGGCCGTGGAAGTCTCTTTTAAGGGTCCCATAGTGACCGTCAGTGTGCCCAGTGTGGAGTTTGGGCTCATGAAGCTCGGGGAGCAGACACAGACCACTCTGCTCCTCACTAACATTACCCAGCAGGAGGCGAACTGGACACTGAAGGAGAGGTGTGACCGTCAGCAGGACCACCAGGAGATACAGATCTCAGTGGAACCACGCACAGGTGTGCTGTCCCCCTTGGCCTCTTGCAGTGTGGATGTGCTATTTAGTCCCCATTTGTGCCAGCGATATGAAACAGAGCTGGTGTTGACAGTGGAGAATGGAACCGGATGTCACCTGTCGGTGCAAGCAGACGTGCAGTGTCCACAGGTGTGTCTGCTGAACTGTGAGCTGCTCTTCTCTGAACTCTACCTTGGAGTTGCTGCAGAGGGAACCGTCACTATCTTCAACCAGACGCTGCTGCCTTCACACTTCAGCTGGATGGATCAGCTCCAGGGTAAACAGGCTGAACTGTGCTCAGCCAGTTTTGACCCCTCTTCTGGCTCACTGGGACCTAATGCCTGTTTGGAGATCACAGTTCATTTCATCTCTCACACAGATCTGGATCTGACTGAGGTGGCTGCTCTCTGTGAGGTCCAAGGGATGAACTCTCCCCTTGTTGTTGGCATCACGGCTTCCAAAACCAAGAAACTCAGTGTGTCCTACTCACTGCCCAGTGTCTGCTCTCCTCCAGATGACGAGAGACCCTCAACACTGTTGCTCGACTTTTGTGATGACGTCATTTTGAACAGAGCCGTTACTAAGCAGTTATTGATAACCAATCAGACTGCTATCCCGGCCCCTTTCCACATAGAGGCAGATTATTTCACATGCCATGCCTCAAAGCCAAACAACCAGTCAGAGAAAAGAATGACATACGTCAAGAAGCCGCTCCACTATGTTCAAGCTCAGAAAATAGAAGAAAAAGCACTTAAGGAGTTTGTGAGCAGCCTGCTGGCTAATGGAAAAGGTGCAGCTTTCTTTGTCCTGCCAGACACTGGGATGCTGGGAGCCTTTGAGACCCAGACTGTGGATGTCACTGCCTACACGGACATGTGGGGCGAATACAGAGATCACCTCATATGCAAAGTGGGGGACCTCAAGCCCACGCTCATTCCCATGCAGATGACGGTGACAGGCTGCCCACTCTACTTCCAAATCACAGGCCCACGTCCAGACAACCAGAACCAGGGACCAAAAACACAGTTTGGCACTCATGTGTCAGGAGGTGACACGGTGTCTCGTTCTCATCGCATCCACAATCCGACCATGTTTGATATTCGCCTGGACTGGGAAACATATAACATAGATCAGAATGACCATAAACTGGTGGACGTTGTGGTGGCATATGGAGACACCTTTCCAGTTAAAGATGCTGATGGCAACGAGGTGTTAAATGGAGCATTAAGGATTTCTGGTGGGAGTGCTCAAACAGCCTGGGAAGGAAATAAGACCTCAGGTTCTGAGGGGACGAGCTCCCCCCTCTGTAGCATGACCAGTGGGGAAGCAA--AGGAATATGT------------ATCCGAGGAAGAGGAAACCTGTCTCTATCCCTCTCCTGCAAAGAAAAAACTCTTGTCTGTTCACATCAGACCGCATGTGGGCGACCTCTCGGATTACCCATACTGCATCACACCCCAGCAATTAGTGATTCCAGCAAAGAGCAGCAGCACCATCCATGTATCTTTCACTCCTTTGA------CTGGGTCAGGTTGTGAGTCCAGATGTGTGGGCCTGGCTCTGGGCTTCATGGGACTAGACTCTGAGATGGCTGCCTGCGTCCCGGGTAAAGTTGTGAGAGCTCAGGGTTTGGATTTGGAGCCCGTCAGAATTGATCTACTCGCAGTCGTTAAGCCGTCATTGCTGTTGGTGCAGATAGAGGAGGATGAGGGGGTGCTGGAGTTTTATGCCTCAGCCGGTGATTTACTGAAGGCAGAATCA---GAGCTGGTAGTTCGTGAATTTGACACCACACGGGCCTTTCAGCTGAGAAACAACTCAGAAATGCTCCTCCACTTCAGCCTGGGGACTCAGCCTCCCTTTAAGGTGGTGAAGCAGCAGCTTGAAGTCCGGACCAGCAGCTCCAGCGACCCACCTACTGGTGACAGCCAGGCTCTGGTGCTGCACCCACAGCAAAGCATGCAGGTGAAGGTGGCCTTCCACTGCTCCCTGCCCCTTCTGGACCATGCAGACCAGGCAGAGGAGGAAGTCCCTCCGGGGGTGACGCTGATCCATCGTGCAGGAGAGGGAAGGAAGCTGAGGTTCCAGCAAAACCTCCTGATTCACTACAACGACAACAGATTGCAGACGGTGCCTCTCTGTGCCTGTTTATATCTCCCTACGATGCGTCTGTCCAGGGACAGCATCGACTTTGGGTTCTGCTTCGTGGGGCAGACGCTGATAACAGAAGTCAACCTCCACAGAAACAGAGCCCTCACTTACTGGAAATCAGTTATTGAGTCGGATGAAGGAGACTCCCATGTGTTCAGAGTCACACCAGACTTCGGGCTCCTCAGGTCAAAGGAGCTTAACGTCACCAGCTGCAGCCACTGTCTCCAGATCAGCTTTACTCCCAGTGAGGACGGAGTGTTCAGGGCCGTTGTGGTAATCCAGTCCCCTCTGATGAAGACCCCCCCCACTCTGCAGCTCCAGGGAACCGGATCCTTTGACAAAGTGTACAGGTCCAACTCGATGTCCTTAAAACATCACAGTCGCACA---ATCAC---------CACCTGTTCTCCTTAAATCAACT-TGT-----TCATTTA--GGAATGTAAATAAATATG |||| | | ||||||| ||||||||| |||| | |||||| |||||||||||||||||||||| ||||||||| ||||| |||| |||| || |||| |||||||||||| || |||| |||||||| || ||| ||||| |||| || ||||| |||||||||||| ||||||||||||||| ||| ||||| ||||| ||||||| | || |||||||| |||||||||| ||||||||| | |||| |||||||||| ||||| |||||||||||| ||||||||| || ||||||||| | | |||||||| |||||||||||| ||||| ||||||||||||||||| || || |||||| ||| ||||||||| ||| ||||||| |||||||||||||||||||| | ||| |||||||||||| ||||||||||||| ||||||||||||| |||||||| | |||||| | || |||| | || |||| |||| ||| | || ||| | | ||| || |||||||| ||| ||| ||||||| ||||||||||||||||||||| ||| |||| || |||||||||||||| ||||||||||||||||||||| | || ||||||||||| ||||||||| |||| | |||||||||||||| || ||| | |||| || ||||| ||||||||| |||| ||||||||| ||||| |||| ||||||||||| | |||||||||||||||| ||||||||| ||| | |||| || || | || |||| | ||||||||||| | ||||| ||||||||||||||||||||||||||||||||||||||| || ||||| ||||| |||| ||||| ||| ||| |||||||||||| || | ||| |||||| ||| ||||||||||| |||||||||||||| | ||||||||||||||||||||||||||| | ||||||||||||||| |||||||||||||||||||||||||||||||||||||| |||||||||| ||| |||||||||| ||||||||||| ||||| |||| ||||||||||||||||||| | ||||||||||||||||||||||||||||||||||| |||||||||||||||| ||| ||| ||||||| || |||||||| |||||||| |||||||| |||||||||||||| || ||||||||||| ||||||||||| || ||||||||||| ||||||||||||||||| | ||| | | |||||||||| ||||||||||||||||| |||||||||||||||||||||||| ||| ||| |||||||| | |||||||| |||| ||| ||||| ||| ||||||||| |||||||||| |||||||||||||||| |||||||| ||||||| ||||| | |||| |||| || |||||||| ||||| ||||| || ||||| ||||||||||||||||||||||||||||||||||||| ||| || ||| |||||||||| |||| | ||||| || ||||||||||||||||||||||| ||||| ||| ||||||||| || |||| |||||| |||||||| ||||| |||||||||||||||||||||||||||||| ||||| | ||||| || ||||||||||||||| | ||||| ||||||| ||||||||||||||||||||||| |||| |||||| ||||| ||||||||||| |||| |||||||||||| || |||||||||||||||||||||| |||||||| |||||||| || |||||||||||| |||||| ||||||||| |||||||| ||||||||||| ||||| ||| |||| ||||| || ||||||||||||||| || |||||||||||||||||||||||| ||||||| |||||||||||| | |||||||||||||| | | ||| ||||||||||||||||||| |||| |||||||||||| ||||||| |||||| ||||||||||| ||||||| | | ||||||||||| ||||||||||||||| ||| ||| |||||||||| | || |||||||| |||| |||||||||| |||||| ||||| ||| ||||||||||||||||||||||||| ||||||||||||||||||||| ||||||||| |||| |||| |||||| || |||| ||| |||||||| ||||||||||||||||||||| ||||||| |||| |||||||| |||| ||| | || ||||| |||||||| |||| | ||||||||||||||||||||||||| |||||||||||||||||||||||||||||| ||||||||||||||||||| |||||| | ||||||||| ||||| | ||||||||||||||| || || |||||||||| ||||| |||||||||||||||||||||||||||||||| |||||||||||||| ||||||||| ||||| | |||| | |||||||| ||||||||| ||||||||||||||||||||||||| | | || | |||| ||||||||| ||| || |||||| | ||||||||||||||||| ||||| || |||||||||||| ||||||||||||| || |||||||| || |||||| ||||||| || |||||||| ||| ||||||||||||||| |||||||||||||||||| | |||||||||| |||||| || | || |||||||| ||||| ||||||||||||||| | | |||||||||||||||||||||||| |||||||||||||||||||||||||||||||||| |||||| ||||||| | ||||||||||||||||||||||| ||||||||||| ||||||||||| |||||||||||||| |||||||||||||| || ||||| |||||||||||||||||||||||||||| ||||||||||||||||||||||||||||| | ||||||||||||||| |||||||||||||||| | || ||||||| |||||||||| |||||||| || ||||||| |||| ||||||| |||| || |||||||||||||||||||||||||||||||| ||||||||||||| |||||| |||||||||||| ||||||||||| ||||||||||||||||||||||||||||||||||| | || | || | ||||| ||||||||||||||||||| |||||||||||||||| ||||| ||||| | | || |||| |||||| | ||||| | || |||| | |||||| ||| |||||||||| | ||||||||||||| |||||| ||||||| |||| |||||||||||||| | ||||| ||||| | ||| |||| |||| |||||||||||||||||||||||||||||||||||||| |||| |||||||||||||||||||||||||||||||| |||||||| ||||||| ||| ||||| ||||||||||||||||||||||||||||| |||||||||| | |||||||| |||||||||||||| |||||||||||||||| |||||||||||||||||||||||||| ||||| || |||||||||||||| |||||||| || ||||||| |||||||| |||||||| |||||||||||||||||| ||||||| |||||||||||||||| |||||||||| |||| ||||| ||||||||||| ||||||| || |||||||||| ||||||| |||||||| ||| ||||||| |||||||||||| |||| ||| ||| | |||| ||||| | || ||| ||||||| ||||||| |||| ||| |||||||| ||||| ||||||||||||| ||||| || ||| ||||||||||||||||||||| |||||||||| | |||||||||||||||||||||||||| || || ||||| | |||||||||||||| ||| || || || || ||||||||||||||||||||||||||| || |||||||||| | | |||| ||||||||||||| ||||| || ||| ||| ||||| ||| ||| |||| ||||||||| |||||||||||| | ||||| ||||| | ||||| |||||| |||||| |||| || |||||| ||| ||||||||||||||| ||||| ||| ||||||||||||||||||||||||| |||||||| ||||||||||||| | | |||||| | |||| ||||| ||| || ||||||||||||||||| ||||||||||||||| ||| |||||||||| |||||| |||||||| |||||| |||||||| || ||||||||||||||||||||| ||||||||||| ||| |||||||||||||| | |||||| |||||||||||| |||| | ||| |||||| |||| ||||||||| | ||| ||||||| ||||||||||||||||| AGTCGAATTAGCCTTTTCCTGGTGTGAGGACAGCAACCTTCTCCAAATGAACAACCTGATTTCCCCTCAGGACTACCTACCTTCACAAAAACCACGTGTGAAAGCACCAGCACCGATAAAATTGAATCCTGGCAGACCCACCATCGCCTACGCTTTGCACGTGTCCAGGGAGCCTCAGGATGATGGTTATGGTCTAATGCCCAGCCCTGAAAAGATAATCCCCGAAATGAATGAGTCAGATCGCAGCCTGACGTTTAAATCCAGCTCAGATACCCCAAAGAGGAAGAAAACCCCCAAGGAGACGCGGAACCAGACCAAACCCAGACCAAAGTGGAAGGATGAGCTGAGCGCAAAGGATCGGGCAGAGGGATGGGAACAACTTCAGAGGCTTAAAGATCGACACAGCTTCCTACGCAATCCTCGCTTCCTTCCTCCAAGTGCGCAGCAGGGTGGCACATCCCTCATCCAGCCCAGAGCCAAAGCGGGGAAGACAGGGCATGTGAGGAGAGGGATGGAGGAGCACAGCTTCACTGATGATGTGGTCCCAGTCTTCCTTGCAAAACCCCCAGTGGTGGTTTTCACTGACTACAGTGTGGGACATGTTTATGAGACGACACTGGAGCTGAAAAATTTGACTTCTGCAAGCCGCACTGTTCGGGTCATCCCTCCTACCACTCCTTACTTCTTTATTGGCCTGGGGAGGTTTCCTAGTGAGGGCGGCGTTGTCGCCCCAGGGATGAGCTGTAAGTACTCAGTGCGCTTTGCTCCAGACTCCCTGGGGGACTATGAGGACTTCATAGTGGTAGAGGCCCAGGCTGAACACCTGCTTGTGGTACGCATCGCAGCCAGACGACCCCCTCCAATACTCACATTACCAAGAGTTCTGGACTGTGGTTTCTGTCTGATTGGAGGGGTAAAGTTTGTGGAGCTCCTGTGCCAAAATGTCGGCCTCAGCACCGGGACCTTCTGCATCATCCCTAAGAACCAGTGGCCAGTCTCGAACCTCAGGTCTGTGGCAAGAACTTTCTTTTCTGAGCAGCCGCCCTTTGCAGTCAGCCCGTCTCTTTTTGTGCTGCAGCCAGGAGAGGCCATTGTGATGGAGGTGGTTTTCTTCCCCACCACTGCGGAGAAGAGCTGTCAGGTGTTCACTGTGGTGTGTGACAACTGCCAGGTGAAAGACATTTCCATAGAAGGTGAGGGCCAGCTGATAGCACTTGAGCTTGTGTCTGTATCAGGGAAGAAAGAGCCTCCAGTGGTGGGAGAGGTTCACGACCTCACTGCAGAGCACTTTGTGCGTTTCAGCCCGTGTAACCCTCACTCTGTGCAGCGGAAAAAAGTCATCATTAGGAACAATGTCCACTTGGAGCTGCCTTTCCACTGGCAGATCATGGAGCCAAACTTGCACCCTCTGCTTCCAGGGGAAACCCCCGAGCCCTCCTATATCCAGTCCCACCTGGCCACAGACGATGTTTTCCAAGTCAGCCCTTTAACAGGTGTTCTCCCACCCTGTGAGGAACAGGAGTTTCTGTTCACATTCTGTCCCAAAGAGTTGAAGGATTACCACAGTGTCTGTCACTTAGTCCTGAGGGACGTCCCCGAGCTGCCACCCGAGCCTAGTGACAGCAGTGTCCTTCAGCCTGTGCGCACTGGCTCCAAAGTAAGCGATGTCACTGTAATGGGGATAGAAGTCAAGGGGTCAACAGAGCCGTACCAGGTCCTACTGGAGCCCTACACTGTTTTGATCCCTGGAGAGATTTTTATTTGCACAACCACACGCAGGCGATTCAAGATGTGGAACCACAGCAGAACCCACATCTTCTTTCACTGGGAGAGAATGAGCAGCAGCAGCCACATCATAGAAGTAGAGCCCTCTGCTGGTACAATAGAGGAGAACGAGTGCTTTGACTTCGACCTGATTTTGAATGGAGGGAAACCAGAGAGAGTTGTGACCAGCCTGGTCTGCCACATAGAGCACCACCATGAGCCCGTCACTTTGCCCCTGGAAGTCTCTTTTAAGGGTCCCACAGTGACCCTCAGTGTGCCCATTTTGGAGTTTGGGCTCGTTAGACTCAGGGAGCAGACACAGACCACGCTGCACCTCACTAACATCACCCAGCTGGAGGCCTGCTGGACACTGATGGAGAGGCATAATAGTCAGCAGGAC---------TCACAGATCTCAGTGGAGCCATGCAGAGGTGTGCTGCCTCCTTTGGCCTCGTGCACTGTGGATGTGATATTTACTCCCCGTTTCTGCCAGCGATATGAAACAGAGCTGGAGTTGACAGTGGAGAATGGAACAGGATGTCACTTGTCAGTGCGAGCAGATGTACAGTCTCCTCAGGTGTGCCTGCTGAACTGTGAGCTGCTCCTCTCTGATCTCTTTGTTGGAGTTCCTGCCAAGGCAGCCATCACTCTCTTCAACAAGACCCCCCTGCCTTCACACTTCAGCTGGATGGCTCAGCTCCAGGGTAAACAGGCTGAACTGTGTACAGCCAGTTTTGACCCCTCATCTGGCACTCTGGGACCTCATGCCAGGTTGGAGATCACAGTTAGCTTTATTGCTCACACAGACCTGGAGCTGACTGAGGTGGCTGCTCTCTGTGAGGTCCAGGGGATGAACTCTCCTCTTGTTGTTAGCATCGTGACTTCTAGAACCAAGACGCTCAGTGTGGTCTACTCACTGCCCAGTGTCTGCTCTACCACGGACGGTGAGACCACCTCAACACCGTTACTTGACTTTGGAGATGACGTCATTTTGAAGAGAGCTGTCACTAAGCAGTTACTGATAACCAATCAAACAGCTATCCCTGCTCCTTTCACAATAGAGGTGGAGTATTTCACCTGCTGTGCCTCAAAGCCAAATAACCAGTCAGAGAAAAGATTCACATACGTCAGGAAGCCACTTCTCTTGGTTCAAGCAAAGAAAGTAGAAGAAAAAGCACATGAAGAGTTTGTGAGCAGCCTGCTGGCTCATGGAAAAGGTGCAGCTTTCTTTGTCCTGCCAGATTCTGGGACGCTGGGACCTTTTGAGACCCAGACTGTGGATGTTACTGCCTACACTGACATGTGGGGGGAATACAGAGATCATCTCATATGCAAAGTTGGAGACCTTGAGCCCACGCTCATTCCCATGCAGATGACAGTGACAGGCTGCCCACTCTACTTCCAAATGATAGGCCCACGTCCAGATGACCAGAACCAGGGACCTGTCATACGGTTTGGCGCTCATGTGTCTGGAGGTGATACAGTGTCTCATTCTGTTCGCATCAACAACCCCACCATGTTTGATATTCGCCTGGACTGGGAAACGTATAACATAGATCCCAATGACGGTAAACTGGTGGATGTTGTGGTGGCGTATGGAGACACCTTTCCAGTTAAAGATGCTGATGGTGATGAAATATTGAGCGGAGCGTTAAGGATTTCTGGTGGGAACCTTCAAACAGCCTGGGAAAGAAATGAGACCCCGAGCTCCAAGGGAACGAGCGACTCCCTCCGAAGTGTGACTAATGGGGA--CAAGGAGGAATATGTGTGTGAGGATGACTGTGAGGAAGAGGAAAGCTGTCTTTATCCCTTTCCTTCAAAGAAAAAACTCATTTCTGTCCACATTACACCTCATGCGGGCAACCTCTCGGATTACCCATACTGCATCACACCCCAGCAAATAGTAATTCCAGCAAAGAGCAGCAGCACCATCCATGTTTCTTTCACCCCTTTGACCCTTTCTGAGTCAGCTTGTGAGTCCAGATGTGTGGGCCTGGCTCGGGGCTTCATGAGTCTAGACTCCGAGATGGCTGCCTGTGTCCCGGGTAAAGTTGGAAGAGCTCAGGGTTTGGATTTGGAGCCTGTCAGGATGGATCTACTCGCAGTTGTTAAGCCTGCAGTGCTGTTAGTGCAGATGGAGGAGGACGAGGGGGTGCTGGAGTTTCATGCCTCTGCCGGTGATTTACTGAGGGCAGAATCACAGAAGCTCAGAGTTCATGAATTTGACATCACACGGTCCCTTCAGCTGAGGAACAACTTAGAAATGCCCCTATACTTCAGACTGGGGACTCAGACTCCATTTTTAGTGCTCAAGCCGCAGCCTCGAGCCCGAACCAGCATCTCCAGCAACCCGCCTTCTGGTGACGGCCAGCCTCTGGTGCTGCAACCACAACACAGCGTGCAGGTGAAGGTGGCCTTCCGCTGCTCCCTGTCTCTTCTGGACCATGCAGACCAGGCAGACGAAGACATCCCTTCTGGGGTGACGCTGATTCATGGTACAAAAGGGGAAAGGAAGCTGAGGTTCCAGCAAAACCTGCTAATTCACTACAGCAAAAACACCCTGCAGACGGTGCCACTCTGCGCTCATTTGGCTCTTCCTACAATGAATCTATCCAAAGACAGCATCAGCTTTGGGTTCTGTTATGTGGGACAGACACAGATAAGAGAAGTGAACCTCTACAGCCACGGAGCCCACACACACTGGAAATCAGTTACAGAGTCAGATAAAGGAGACTCCCATGTGTTCAGAGTGACACCAGATTTCGGGCTCCTCAAATTGAGGGAGCTCCATGTCAGCAGCTACAGTCAGTGTCTCCAGATCAGCTTCACTCCCAGTGAGGACAGAGAGTTCAGGGCCACTGTGGTGATCCAGTCTCCTCTGGTGAAGACCTCCGTCACTCTGCAGCTCCAGGGAACAGGATCCTTTGATGAAGGGTACAGGTCCAACTAACTATCCTTATAACATCACAGTCACACAGTGAACACCTGCTGTTTCACCTGCTCTCTTTAAATCAATTGTGTTCAAGTCATTTATGAGAATGTAAATAAATATG ******アラインメント(HSP)****** スコア値(bit):178.918 E-value:3.73446e-39 ATGGGGAAAGACACTTTGTCCAACCTCATAAAGACAAAGACTGGCCAAGGCGGCTTCCATGACAGATATGTCGAGGAGCTCCAGCAGGCTCATTCTGAGTACAACCGGTCTATAAAACAGGCGGACATGCTGGAGAGTCACATCATTCAGGCCAGAGATCGGGCCGCGGCCATAGA || ||||||||||||| ||||||| || | |||||||||| ||| | | || ||| ||||||||||||||| |||||||| || |||||||||||||| |||| ||||| ||||||| |||| ||||||||||| ||| | ||| ||||||||| |||||| || | || ||| ATCGGGAAAGACACTTCGTCCAACTTCTTCAAGACAAAGAATGGACGAAGCAGCTACCATGACAGATATGTTGAGGAGCTTCAACAGGCTCATTCTGAATACAGCCGGTGTATAAAAGAGGCTGACATGCTGGAAGCTCATTTAATTGAGGCCAGAGCTCGGGCTGCAGACACAGA
コメント