遺伝子領域が重なっているということ・・・

 遺伝子というのは、なんらかの形質を子孫に伝えるための基となる1要素情報が塩基の並びとしてコードされているゲノム上の領域を指していると、わたしは考えています。簡単にいうと、ひとつの蛋白質アミノ酸配列情報が格納されているDNA上の塩基配列領域ということになります。しかしながら、ヒトでは、スプラシングバリアントが50%以上の遺伝子に存在しているといわれているように、同じ遺伝子領域でも異なる転写産物が合成され、異なる蛋白質が作成されることが多々あります。さらに、non-codingRNAのように、蛋白質をコードしていない転写産物もありますので、もう少し研究が進むと、遺伝子の概念が変更されるかもしれませんね。
 ところで、約7年前に、遺伝子の情報処理に取り組みをはじめたころ、蛋白質アミノ酸配列をコードしているゲノム上の領域の合計は、ゲノム全体の約5%で、後の95%は、どういう役割を担っているのかわからないと教えていただきました。広大な領域が遺伝子と遺伝子の間にあるのだなと思ったのです。しかしながら、図1で示した例のように(またまたFGFR1で、申し訳ありません)FGFR1のmRNAは、長いもので約5000baseありますが、遺伝子領域は、8番染色体の38,445,400から38,386,742で、60,000程度です。つまり、FGFR1の遺伝子領域の一割がmRNAになるエクソン領域ということになります。ということは、ゲノムの95%ある”かつてジャンクと呼ばれていた領域”約半分は、イントロンなのかもしれません。
 このFGFR1の3'末端領域と重なるように別の遺伝子LETM2*1の転写領域が逆ストランド側にあります。(緑色は、「AssEST」では、コンプリメンタリーのシンボリックカラーになっています)このような遺伝子領域に重複部分がある関係を「オーバーローカスしている」と呼ぶようです。ところで、よく見るとこの二つの遺伝子の転写産物は、実際には重なっていないようです。オーバーローカスに関して、詳細に見て見えてくるものについては、次の機会にしたいと思います。
 「AssEST」で見ていると、このように密集しているケースが多いように感じます。これについては、いつか統計情報を出してみたと思うのですが、まだ、着手できていません。どなたか、遺伝子の密集度について、論文なり著作物などご存知でしたら教えてください。


図1:FGFR1とLETM2の遺伝子領域が近接している様子

*1:Hs.632048:Leucine zipper-EF-hand containing transmembrane protein 2