トランスポゾン・・・起源はDNA修復機構?
ブログもよろしく。
参考 : 逆転写酵素、偽遺伝子、ジャンクDNA、遺伝子重複:パラログとオーソログ、ヒトゲノム、一塩基多型
トランスポゾンは、細胞内で、ゲノム上の位置を移動することができる塩基配列で、動く遺伝子ともいいます。
遺伝子が動く、というだけでも驚きですが、
トランスポゾンは、ヒトゲノムの、なんと40%以上を占めています。
LINE というレトロポゾンは、ヒトゲノムの20%もあるようです。
ちなみに、ヒトゲノムでは、タンパク質をコードする領域は1%以下です。
もっとも、原核生物は、イントロン等、タンパク質に翻訳されない領域は少ないです・・・
詳細不明ですが、原核生物にも、トランスポゾンはあるようです。
P因子(ショウジョウバエのトランスポゾン)が有名です。
トランスポゾンには、
DNA断片が直接転移するDNA型と、
転写と逆転写の過程を経るRNA型(レトロポゾン)があります。
DNA型トランスポゾンは、トランスポザーゼという酵素により転移します。
尚、レトロトランスポゾンにおける、トランスポザーゼに相当する酵素は、インテグラーゼといいます。
レトロポゾンは、レトロウイルスの起源である可能性も示唆されています・・・
レトロウイルスが、レトロポゾンの起源の可能性はどうでしょうか?
レトロポゾンがコードする逆転写酵素は、テロメアを複製するテロメラーゼと進化的に近いです。
逆転写酵素を持つ原核生物は、みかけませんが・・・
原核生物に感染する、ファージにも、レトロウイルスがいるのでしょうか?
レトロポゾンには、LTR型と、非LTR型、があります。
非LTR型は、更に、LINEを持つものと、SINEを持つものがあります。
最もよくみられる SINE は、Alu 配列で、ヒトゲノム中に約100万コピー存在します。
レトロポゾンは、自分自身をRNAに複写した後、逆転写酵素によって DNAに複写し返されることで転移します。
この複製による転移では、因子のコピー数が急増するため、ゲノムサイズが非常に増大します。
レトロポゾンは、植物で特に多く、コムギでは、ゲノムの90%を占めます・・・
なぜ、植物に多いのでしょうか?
転移は、ゲノムのDNA配列を変化させることで、突然変異の原因となり得ます。
一方、多様性を増幅することで、生物の進化を促進してきたとも考えられています。
転移が不完全に起こると、染色体にジャンク配列を残すこともあります。
偽遺伝子という、機能を失った遺伝子もあります。
ヒトゲノムの約97%は、非タンパク質コードDNA(ジャンクDNA)のようです。
このことは、自然選択があまり働いていないことを示唆しています・・・
どうして自然選択が働かないのでしょうか・・・
トランスポゾンは、塩基配列を別の場所にコピーするという意味で、相同組換えに似ているような気がしますが、
これと、自然選択が働かないことと関係があるのでしょうか? DNA修復機構はトランスポゾン?(ブログ)
遺伝子重複は、遺伝子を含むDNA領域が、重複する現象です。
同じ機能を持つ遺伝子が二つあると、
一方が機能を失っても、もう一方が正常に機能していれば、生物の生存に支障がないため、変異が蓄積されます。
重複遺伝子は、共通祖先の出現以来、最も重要な進化の原動力であった、という説もあります。
ヒトゲノムの核ゲノムは、30-31億塩基対あります。
尚、体細胞は2倍体なので、量も2倍あります。
ゲノムには、個人差があり、ヒトゲノムでは、個人間で、1000塩基に1つ程度異なっています( SNP )。
トランスポゾン(動く遺伝子、転移因子)
細胞内で、ゲノム上の位置を転移することができる塩基配列です。
ヒトやマウスのゲノムにおいて、タンパク質をコードする領域は1%以下であり、
残りの40%以上は、トランスポゾンが占めています。
LINE というレトロポゾンは、ヒトゲノムの20%もあるようです。
脊椎動物の遺伝子は、かなり相同性が高いため、
遺伝子以外の領域で多様性を生み出している、トランスポゾンが、
種分化において重要な役割を担っている可能性もあるようです。
P因子(ショウジョウバエのトランスポゾン)が有名です。
P因子は、わずか50年程前に、水平移動により、自然界のショウジョウバエに持ち込まれたと考えられています。
トランスポゾンには、
DNA断片が直接転移するDNA型と、
転写と逆転写の過程を経るRNA型があります。
トランスポゾンは、狭義には前者のみを指し、後者は、レトロポゾンといいます。
レトロポゾンは、レトロウイルスの起源である可能性も示唆されています。
レトロポゾンがコードする逆転写酵素は、テロメアを複製するテロメラーゼと進化的に近いです。
転移は、ゲノムのDNA配列を変化させることで、突然変異の原因となり得ます。
多様性を増幅することで、生物の進化を促進してきたと考えられています。
DNA型トランスポゾンが転移するためには、トランスポザーゼという酵素が必要であり、
これは、トランスポゾン自身がコードしています。
トランスポゾンは、末端に逆向きの反復配列を持っており、
トランスポザーゼは、この配列を認識してトランスポゾンをゲノム配列から切り出します。
トランスポザーゼは、適当なゲノム配列に、再度トランスポゾンを挿入します。
レトロポゾンは、転写を受けた後、自身がコードする逆転写酵素によって mRNA から cDNA を作り出し、再度染色体に挿入されます。
いずれも、遺伝子領域に挿入されると、変異を引き起こし、
DNA型は、切り出しの際に、周りのDNA配列を削り、染色体異常を誘導することもあります。
また、転移が不完全に起こることで、染色体にジャンク配列を残すこともあります。
レトロトランスポゾン (レトロポゾン) 遺伝子重複
トランスポゾンの一種であり、多くの真核生物のゲノム内に普遍的に存在します。
レトロトランスポゾンは、自分自身をRNAに複写した後、逆転写酵素によって DNAに複写し返されることで移動、つまり転移します。
DNA 型トランスポゾン(狭義のトランスポゾン)が転移する場合と異なり、
レトロトランスポゾンの転移では、DNA配列の複製が起こります。
レトロトランスポゾンは、植物では特に多く、しばしば核DNAの主要成分となります。
トウモロコシでは、ゲノムの80%、
コムギでは、ゲノムの90%が、レトロトランスポゾンです。
レトロトランスポゾンの複製による転移では、因子のコピー数が急速に増加するため、ゲノムサイズが非常に増大します。
DNA型トランスポゾンの場合と同様、遺伝子近傍または遺伝子内にDNA配列挿入がされることで、突然変異が起こり得ます。
更に、レトロトランスポゾンにより引き起こされる突然変異は、
挿入部位での配列が複製機構による転移の際に保持されるので、比較的安定です。
レトロトランスポゾンの転移と、そのホストゲノム内での残留とは、
双方とも、長年にわたるレトロトランスポゾン・ホストゲノム間関係の結果、
両者への有害な影響を避けるように、レトロトランスポゾン及びホストゲノム内にコード化された因子により制御されているようです。
レトロトランスポゾンとそのホストゲノムとが、お互いの生存機会を最大化するよう、
転移、挿入の特異性、そして突然変異形質を統御する機構を共進化させてきた方法は、詳細不明です。
レトロトランスポゾンの種類
レトロトランスポゾンは、クラスIの可動因子です。
末端に長い反復配列を有する、LTR ( long terminal repeat ) 型レトロトランスポゾンと、
それ以外の、非 LTR 型レトロトランスポゾン、があります。
LTR 型レトロトランスポゾンは、
末端に、100 bp から5kb超の、長く続く反復配列があります。
Ty1-copia 群と Ty3-gypsy 群との2つに分けられます。
植物では、Ty1-copia 群と、Ty3-gypsy 群のレトロトランスポゾンのコピーが、多数(一倍体の細胞核当たり、数百万コピーまで)発見されます。
Ty1-copia 群レトロトランスポゾンは、単細胞藻類からコケ植物、裸子植物、被子植物に至る、広範囲の植物種で、極普通に見られます。
Ty3-gypsy 群レトロトランスポゾンも、裸子植物、被子植物双方を含め、広範に分布しています。
LTR 型レトロトランスポゾンは、ヒトゲノムの約8%を構成します。
非LTR 型レトロトランスポゾンは、
長鎖散在反復配列( long interspersed nuclear element :LINE ) を有するものと
短鎖散在反復配列( short interspersed nuclear element :SINE ) を有するものとの、2種類に分けられます。
植物では、これらも、多くのコピー数(250,000 まで)が見いだされます。
逆転写された RNA 分子を表現する、長いDNA配列であり、
本来なら RNA ポリメラーゼ IIにより mRNAに転写されるべきものです。
LINE は、偽遺伝子と呼ばれることもあり、イントロンやプロモーターを含みませんが、
内部に逆転写酵素やインテグラーゼ(レトロトランスポゾンにおける、トランスポザーゼに相当する酵素)のコードを持ち、
これにより、コード部分自身と、その他の非タンパク質コード部分とを併せて、複写できます。
LINE は、自分自身の複写により移動するので、ゲノムを増大させます。
LINEは、ヒトゲノムの 21% (約 500,000)を占めます。
逆転写された RNA 分子を表現する短いDNA配列であり、
本来なら RNA ポリメラーゼ IIIにより tRNA、rRNA、その他の核内低分子 RNA に転写されるべきものです。
SINE は、有効な逆転写酵素タンパク質のコードを持たず、転移は他の可動因子に依存します。
最もよくみられる SINE は、Alu 配列です。
Alu 配列は、約 300 塩基対の長さがあり、タンパク質コード配列を全く含まず、制限酵素 Alu I で認識されます( Alu、と云う命名の由来)。
ヒトゲノム中には 約 100万コピー存在し、その約 11% を占めます。
SINE は、ヒトゲノムの 13.5% を占めます。
LINE 及び SINE は、双方とも、その目的が判明しておらず、利己的なDNAや、ジャンクDNAと呼ばれています。
レトロウイルスは、レトロトランスポゾンのように振る舞い、逆転写酵素とインテグラーゼを含みます。
RNA依存性DNAポリメラーゼで、逆転写反応を触媒する酵素です。
一本鎖RNA を鋳型として DNA を合成(逆転写)するもので、レトロウイルスの増殖に必須の因子です。
この酵素の発見により、遺伝情報は RNA から DNA へも伝達されうることが明らかとなりました。
レトロウイルスは RNA しか持っていないため、逆転写して cDNA を作ります。
DNAの配列のうち、かつては遺伝子産物(特にタンパク質)をコードしていたと思われますが、現在はその機能を失っている遺伝子です。
偽遺伝子は、もとの機能を有する配列に突然変異が生じた結果生まれたと考えられています。
ある位置でストップコドンが生じて、タンパク質のペプチド鎖が短くなってしまい、タンパク質として機能を果たせなくなる場合、
正常な転写に必要な、調節配列が機能を失う場合、等があります。
元の正常な遺伝子が別に残っている場合が多いですが、単独で偽遺伝子になったものもあります。
偽遺伝子の種類
1. 正常な遺伝子からイントロン配列が取り除かれて、末端にポリA配列が付いた、mRNAのような構造をとるタイプ。
プロセス型偽遺伝子と呼ばれ、mRNAから、レトロトランスポゾンの逆転写酵素によって作られたDNA配列が、ゲノム内に挿入されてできたと考えられます。
2. 重複偽遺伝子または非プロセス型偽遺伝子と呼ばれるタイプ。
ゲノム内でもとの遺伝子配列が重複し、その一部のコピーが、突然変異の蓄積によって機能を失ったものです。
この場合、まだ正常な遺伝子のコピーが残っているため、生物は直ちに影響を受けることはありません。
3. ゲノム内の単独の遺伝子が、突然変異により機能を失ったタイプ。
遺伝子の産物が、(環境の変化等によって)生物の生存に必要なくなったものです。
ヒト等、霊長目直鼻猿亜目における、約6300万年前に突然変異した、GULO(ビタミンC合成に関与する酵素)遺伝子、
ヒト上科における、2800万年から2400万年前頃に突然変異した、尿酸オキシダーゼ遺伝子があります。
偽遺伝子の中には、転写されているものもかなりあります。
更には、偽遺伝子でありながら、機能を持つ例(偽遺伝子?)もあるようです。
カタツムリの神経で、一酸化窒素合成酵素( NOS )の偽遺伝子から、
アンチセンスRNAが転写され、NOS遺伝子の発現が抑制される例が知られています(ncRNA?)。
染色体、またはゲノム上の機能が特定されていないDNA領域です。
ゲノム解析の結果、
既知の遺伝子と相同性がみられない、または、
相同性が高いにもかかわらず、機能するために必須な配列に変異等があり、実際の機能が疑わしい、といった領域です。
機能していないジャンクDNAの領域では、変異がランダムに発生し、
発生数も多いと予想されるため、種間での比較によってそれらの領域を識別することができます。
偽遺伝子という、無効となった遺伝子もあります。
機能しなくなったウイルスのDNAもあるようです。
しかし、未知の機能がある可能性があるため、ジャンクというのではなく、
非タンパク質コードDNA( ncDNA )のといった用語の方がよいようです。
ゲノム上の塩基配列には、翻訳を受けない、非タンパク質コード領域が多数存在することが知られており、
この中には、DNA複製の開始点である複製起点、
あるいはプロモーター、エンハンサー、サイレンサーといった、
遺伝子の発現を制御する、生命活動に非常に重要な領域が含まれています。
ヒトゲノムの約97%は、ジャンクDNAのようです。
一方、トラフグのゲノムサイズは、ヒトの1/10程度しかありませんが、
ゲノムの1/3に有効な遺伝子としてコードされており、ほぼヒトと同数の遺伝子をもっていると考えられています。
タマネギのゲノムサイズは、ヒトゲノムの約12倍であり、ヒトより多くのジャンクDNAを含んでいると考えられます。
このように、ゲノムにおける、機能を持っている(と推測できる)領域と、ジャンクDNAの領域の比率は、種によって著しく違うようです。
機能していないジャンクDNAが多量にあると、
DNA複製の際に、役に立たないヌクレオシドを作成するために、多くのエネルギーが浪費されることになり、生命にとっては重荷となります。
そのため、自然選択により、ジャンクDNAの量は、削減されると考えられます。
しかし、ジャンクDNAが存在しているという事実は、自然選択があまり働いていないことを示唆しています。
ジャンクDNAが形成され、ゲノムの中で維持されてきた理由
ジャンクDNAは、遺伝子の損傷と有害な変異に対する保護的な緩衝領域として働くという説。
DNAのほとんどの部分が、代謝や成育といった過程に無関係な部分となっており、
ヌクレオチド配列に対する単一の、ランダムな損傷が生命に影響することはほとんど起こりません。
ジャンクDNAは、潜在的に有利な新しい遺伝子として、発現しうる配列の貯蔵庫を供給するという説。
生物の胎児から成体までの成長に伴って、ジャンクDNAは、メタDNA(変化したDNA)としての役割を果たします。
ジャンクDNAは、未知の機能を含んでいるという説。
ncRNAが、ジャンクDNAと考えられていた領域から転写されています。
遺伝子重複(いでんしちょうふく)
遺伝子を含むDNAのある領域が、重複する現象のことです。
遺伝子組換えの異常、
レトロトランスポゾンの転移、
染色体全体の重複、
等により生じます。
遺伝子の重複だけでなく、ゲノム全体の重複もあります。
酵母のゲノムは、1億年ほど前に重複したと考えられています。
植物では、頻繁にゲノム重複が起こっており、コムギは6つのゲノムセットを持つ6倍体です
重複した遺伝子の一方は、選択圧から開放されます。
これは、同じ機能を持つ遺伝子が二つ存在する場合、一方が突然変異を起こして、機能を失ったり、変化したりしても、
もう一方が正常に機能していれば、生物の生存に支障がないためです。
そのため、重複した遺伝子では、単一の遺伝子よりもはるかに速く、経代に伴う変異が蓄積されます。
重複遺伝子は、進化の主要な役目を担うと考えられています。
重複遺伝子は、共通祖先の出現以来、最も重要な進化の原動力であった、という説もあります。
遺伝子重複によって生じた二つの遺伝子は、パラログと呼ばれ、一般に機能や構造が異なるタンパク質をコードします。
異なる生物に存在する、相同な機能を持った遺伝子群は、オーソログと呼ばれ、種分化の過程で生じたものです。
ヒト (Homo sapiens) のゲノム(遺伝情報の1セット)です。
核ゲノムとミトコンドリアゲノムからなります。
核ゲノムは、
30-31億塩基対あり、
細胞核内で24種の線状DNAに分かれて染色体を形成しています。
最大が、2億5千万塩基対で、
最小が、5500万塩基対です。
染色体は、22種類の常染色体と、
XとYの2種類の性染色体に分類されます。
体細胞(核を持たない赤血球を除く)は、2倍体であり、
同じ種類の常染色体を2本ずつ、
性染色体を2本(女性はXとX、男性はXとY)の、
合計46本の染色体を持っています。
生殖細胞は、1倍体であり、
常染色体を1本ずつ、
性染色体を1本の、
合計23本の染色体を持っています。
尚、細胞核中のゲノムは、(フラクタル構造の一種)ヒルベルト曲線と類似した、コンパクト形に折りたたまれているようです。
ミトコンドリアゲノムは、
16,569塩基対の、環状DNAで、ミトコンドリアの中に多数存在しています。
体細胞も生殖細胞も、約8000個ずつ持っています。
ゲノム中のほとんどのncDNAが、
生化学的活性(遺伝子発現調整、染色体の構造形成、エピジェネティクスのコントロール等)を持っていることが示唆されています。
ヒトゲノムの塩基配列の解読を目的とする、ヒトゲノム計画は、
1984年に最初に提案され、
1991年から解読作業が始まりました。
2000年6月に、ドラフト配列の解読を終了した後、
2003年4月に、解読完了が宣言され、この時点でのヒトの遺伝子数の推定値は、3万2615個でした。
しかし、その後の解析により、2万2287個と推定されました(2004年10月、ネイチャー)。
ただし、本計画により解読された配列は、標準配列(複数国、複数人のゲノムDNAの混合試料)の、
ユークロマチン領域を中心とする全ゲノムの99%の領域について、多数決的に決められたものです。
このため、実際の遺伝子数は、個人差等により、多少の変動が見込まれます。
標準配列についても、ヘテロクロマチン領域を中心とした未解読の領域や重複領域等について、解析が継続されているようです。
またゲノムは、1倍体(半数体)の全DNA配列であり、ヒトは2組のゲノムを持ちます。
このため、個人のゲノムでは、父親と母親に由来する配列間でも、差異があります。 SNP
一塩基多型( SNP : Single Nucleotide Polymorphism。複数形はSNPs(スニップス) )
ある生物種集団のゲノム塩基配列中に、一塩基が変異した多様性がみられ、
その変異が集団内で1%以上の頻度でみられるものです。
変異の頻度が1%以下の場合は、突然変異といいます。
ヒトゲノムでは、個人間(相同染色体間)で、1000塩基に1つ程度異なっています。
ある一つの塩基が別の塩基に置換されて起きるため、
一つのSNPには置換前と置換後の二種類の対立遺伝子しか見つからないことが多いです。
まれに、3から4個の対立遺伝子があるSNPもあります。
SNPの起源は、中立進化説によると、種の分化後にランダムに発生したものと考えられています。