動物や植物などのmRNAは、ゲノムの情報が転写されRNAが合成された直後に、スプライシングという加工を受けて、完成されたmRNAとなります。スプライシングとは、mRNAの配列の一部分が切り取られる現象ですが、(といっても、完成形のmRNAになる部分に比べて、かなり大きな領域が切り取られことが、ほとんどです)同じゲノム領域を元に転写されているにもかかわらず、この切り取られ方が異なるmRNAが何種類も存在する遺伝子があります。このようにして生まれるmRNAをスプライシングバリアントと呼びます。切り取られた部分に相当する領域をイントロンintronと呼び、mRNAに残った部分をエキソンexonと呼びます。
 FGFR1には、「AssEST」でデータ処理した結果では、下図で示すように、スプライシングバリアントごとのコンセンサス配列(同じスプライシングパターンを持った転写産物のコンセンサス配列)をゲノムマップして並べて比較することで、少なくとも10種類以上のスプライシングバリアントが存在していることが示唆されます。赤の枠で囲んだ部分が、エキソン−イントロン構造のバリエーションが集中する部分です。


図1:FGFR1エキソン−イントロン構造のバリエーション

このように、エキソンが、ある/ない/位置がずれる といったパターンは、みなさんよくご存知だと思いますが、「AssEST」のグラフィカルユーザインタフェースでは、1塩基のレベルまで寄っていくことができ、引いて見ていただけでは気がつかない現象を発見することもあります。
 下の図は、FGFR1のもっともメジャーなサブクラスターSubclusterの配列アライメント図です。*1


図2:FGFR1の1サブクラスタの転写配列のアライメント。

緑の楕円で囲んである楔(クサビ)のマークは、エキソン−イントロンの境界位置*2を表すもので、楔の位置を境にして、5'側と3'側の配列が、異なるエキソン領域であることを示しています。図で示したFGFR1の場合、このサブクラスタを構成する転写配列の半数で、エキソン−イントロン境の5'側に6塩基のGAP(塩基の表記が*は、GAPを表す)が見られます。6塩基のGAPは、つまり、転写産物のそれぞれの配列が、エキソン−イントロン境界で、6塩基増減しているということを表しています。よく見ると、GAP6塩基領域の5'側2塩基は、”GT”=スプライシングのドナーサイトの塩基です。ゲノムマップの様子を見ると(図3)、”GT”の塩基の並びが6塩基はなれて2箇所あるので、おそらく、スプラシングの開始位置が微妙に異なる2種類のスプライシングイベントが存在しているのでしょう。この現象は、エキソンの有無というバリアントの発生とは、関連なく起こっているようです。この現象は、エキソンの有無ほどインパクトは小さいにしても、SNP1塩基でアミノ酸が置換するというバリエーションに比べれば、2アミノ酸の有無と1アミノ酸の置換という大きなインパクトを蛋白質に与える可能性があります。


図3:FGFR1のゲノムマップの様子。「AssEST」では、コンセンサス配列をゲノムマップしています。しかしながら、GenomeViewerでは、コンセンサス配列を構成している全ての転写配列をコンセンサス配列を介して、1塩基づつゲノムマップした様子を見ることができます。

*1:AssEST」のデータ作成処理では、UniGeneのすべてのクラスタCluster毎の登録配列を塩基配列類似性でアッセンブルして、コンセンサス配列を作っています。その際、各UniGeneクラスタには複数のコンセンサス配列が作成されます。そのコンセンサス配列に属する転写配列群をサブクラスタとして分類しています。同じUniGeneクラスタのサブクラスタのコンセンサス配列どうしは、配列が一部似ていても一部は異なるか、まったく異なる配列となっていますので、スプライシングバリアンントごとの配列集団を表していると考えています。(間違いの転写配列が混入している場合があります。その場合は、ゲノムマップの結果が他のコンセンサス配列と異なるので、判断をすることは難しくありません)

*2:「AssEST」が示すエキソン−イントロン境界の位置は、コンセンサス配列をゲノムマップした場合に得られたものです。ひとつひとつの転写配列をゲノムマップしてものではありません。