cDNA配列

国際塩基配列データベース(GenBank/EMBL/DDBJ)にあるcDNA配列を見ていると、時々変わった配列を見かける。ちなみに特定のプロジェクトに限った話ではない。例えば、cDNAの配列が逆転(相補鎖)して登録されているらしきものや、イントロンを含むものなど。先日は、エキソンの順番がおかしいものを見つけた。ゲノムの配列が間違っていることもあり得るのだが、他のESTやmRNAとの比較や、諸々の状況証拠からこれはcDNAのアセンブルミスと推測した。さらに、この配列のCDSはjoinを用いて記述されているのだ。それも数百ベースを飛ばして。joinとは本来ゲノム上のエキソンをつなげてCDSを記述するための方法である。cDNAにこんな記述をしてしまっていいのか。