蛋白質をコードしているmRNAメッセンジャーRNA)のイントロンにあたるゲノム上の領域にマップされる転写配列は、数多く存在しています。ブログ初回にご紹介するのは、図でもわかるように、転写産物に多くのスプライシングバリアントが見られる遺伝子FGFR1*1 です。この遺伝子は、おもしろいスプライシングバリアントがみられる遺伝子のひとつなのですが、その話は、別の機会に紹介するとして、今日は、イントロン領域にマップされる転写産物(多くの場合、エキソン−イントロン構造を持たない)についてお話します。
ほぼすべてのイントロン領域に、1種類以上のエキソン-イントロンン構造をもたない転写配列がマップされています。このような転写配列の存在は、以前から知られていたと思いますが、我々がこの取り組みを始めたころは、”ゴミ”配列いわれて嫌われ者でした。ところが、siRNAやmicroRNAの登場で”機能性RNA"という言葉が作られて、さらに、蛋白質をコードしないnon-codingRNAの存在がクローズアップされてきております。もう少し正確にいうと、蛋白質アミノ酸配列の情報を運ぶためのRNAmRNA)や蛋白質合成のためにアミノ酸を運搬するためのRNAtRNA)、さらに、蛋白質を合成の役割を担うリボゾームの構造物を作るためのRNArRNA)など、蛋白質合成のセントラルドグマに直接関わる機能を持ったRNAが一般的に知られていたわけですが、それら以外にも、蛋白質合成に直接関与しない機能を持ったRNAの存在が示唆され、ここ3年ばかりは随分と盛り上がっていて、その観点でみたときの”ゴミ配列”は、一点して”宝物”のように光はじめているということなのです。ちなみに、図2は、FGFR1イントロン領域にマップされた転写配列の1例の概略図で、図3は、実際にその位置にマップされている転写配列です。この以前は、”ゴミ配列”といわれていたものでも、異なる研究者から登録された複数のEST(Expressed Sequence Tag)がマップされていることから、転写産物が存在していることはほぼ間違いなく、さらに、その中には、日本が誇るヒト完全長プロジェクトFLJ)の5'クローンの配列も含まれています。


図1:遺伝子FDFR1の領域から転写されたと思われる転写産物をアッセンブルして得られたコンセンサス配列*2をゲノム塩基配列にマップした様子。


図2:遺伝子FDFR1のイントロン領域にマップされた転写産物の例。赤い楕円で示す。


図3:図2を塩基が見えるまで拡大した図。左上の赤い楕円がこのサブクラスタを構成する配列のAccessionで、AK094303.1は、FLJプロジェクトでシーケンシングされた配列。

*1:UniGeneID:Hs.264887 Fibroblast growth factor receptor 1 (fms-related tyrosine kinase 2, Pfeiffer syndrome

*2:ひとつのUniGeneCluserに登録されているmRNA&ESTを配列の類似性でアッセンブルすると、複数のサブクラスタが作成される