転写開始点付近の小さなスプライシング?

 図1は、FGFR1の5'側のゲノムマップの様子を示しています。この図では、FGFR1のサブクラスタ52クラスタの内、エキソン−イントロン構造を持つ比較的長いコンセンサス配列のみ表示するようにしてみました。
イントロンに落ちるような転写産物、3'側にのみ張り付く転写物などは、表示をオフしています。*1


図1:FGFR1の5'側のゲノムマップの様子


図2:FGFR1の5'側のゲノムマップの様子

 さて、図1の赤枠で囲まれた領域を拡大したのが、図2です。この図に、コンセンサス配列の5'端を赤の縦線で示してみました。転写開始点のバリエーションがあるように思われます。転写開始点のバリエーションについては、別にお話するとして、今回は、5'端近辺のゲノムマップのバリエーションに注目しました。図2の青枠で囲んだ部分を拡大したものが図2−Aです。ゲノムと比べて転写配列が小さくスプラシングされているように見える領域を持った転写配列があるようです。このような領域をこのブログの中でのみ、”プチイントロン”と呼ぶことにします。さらに、このプチイントロンを持つ、#29と#35について、詳しく見てみました。


図2−A:FGFR1の5'端領域のプチイントロン

 図3は、サブクラスタ番号#29の5'側の部分を塩基配列が見えるまで拡大した図です。図で示すようには、BE886442は通常のイントロンにくらべて、抜け落ちている領域が短いです。プチイントロンですね。図3−Aで示すように、ドナーとアクセプタの配列2塩基*2は、GG-GGですので、この領域が抜け落ちた原因が、通常のイントロンと同じ機構でスプライシングを受けた結果とは、異なるかもしれません。


図3:FGFR1のサブクラスタ#29のプチイントロン

図3−A:FGFR1のサブクラスタ#29のプチイントロン(拡大)

 図4は、サブクラスタ番号#35の5'端付近の塩基配列が抜け落ちている部分を塩基配列が見えるまで拡大した図です。転写配列BF574608からは、ゲノムの配列約300bpが抜け落ちています。イントロンのドナー側の塩基はGC、アクセプタ側の塩基はAGです。これは、通常のスプライシングと同じ機構で塩基配列が抜け落ちのでしょうか?


図4:FGFR1のサブクラスタ#35の5'端イントロン

 サブクラスタ#29も#35も、注目している領域には、配列が一本しかありません。ひょっとすると”単なるエラー”の配列なのでしょうか?
 よく探してみるとFGFR1に登録されている配列の中に、サブクラスタ#29と同じゲノム領域がプチイントロンになっている配列がありました。図5は、FGFR1で最もEST配列の多いサブクラスタ#52の転写配列が1塩基まで見えるように拡大した図です。ゲノムにアライメントされている転写配列の内、BC015035BF724672の2種類の配列には、AGCTの文字が赤い色になった箇所がたくさん見られます。「AssEST」のビューアでは、配列のアライメント図において塩基表記の文字が赤い場合は、コンセンサス配列と異なる配列であるあることを表わします。つまり、この2本の配列は、この領域においてうまくアライメントできていないことを表わしています。*3


図5:FGFR1のサブクラスタ#52の5'端付近

 アライメントがうまくいっていない領域は、塩基配列の抜けがあるケースが多いので、この2本の配列をゲノムマップしてみました。そうしたら、BC015035は、#29と同じ領域の塩基配列の抜けが確認できました。*4図6は、UCSCのゲノムブラウザを利用して、FGFR1の5'端の問題領域のmRNA&ESTの一本一本のゲノムマップの様子を表示したものです。この図でも、本数は少ないですが、同様のプチイントロンを持つていることが確認できます。





図6:UCSCのゲノムブラウザで見たFGFR1の5'端-mRNA&ESTのゲノムマップの様子

 このような5'端の塩基配列の抜けは、いろいろな転写産物にあるようです。さて、これはいったいどういう現象なのでしょうか?スプライシングと呼んでいいのでしょうか?どなたか、ご存知の方ございましたら、教えてください。

*1:「AssEST」のゲノムビューアでは、非表示にしたいSubClusterをOneClickで隠すことができます。自分でいってしまてはいけないのかもしれませんが、比較したものどおしを近くに並べてみるときには、たいへん便利です。

*2:イントロン領域のはじまりの2塩基をドナー配列と終わりの2塩基をアクセプタ配列と呼びます。ほとんどのスプライシングで、抜け落ちるイントロンのドナー配列とアクセプタ配列は、GT-AGです。

*3:「AssEST」でのアライメントは、ワシントン大学のPHRAPを使って行います。フラップは、配列どうしの類似性が高い領域が長いと少々類似性があまい領域があっても、アライメントしてしまうようです。

*4:BF724672は、ゲノムマップすると全長隙間なくゲノムにアライメントされますので、こちらは、アッセンブル時になんらかの原因でアライメント位置が間違ったのかもしれません。要調査ですね。