Transcriptome Analysis
using Full-length cDNA library
Institute of Medical Science
The University of Tokyo
Junichi Watanabe, M.D. Ph.D.
Oligo-capping
Introducing “5’end-Tag” by Replacing CAP Structure
“Full-Length” mRNA
CAP 5’UTR
3’UTR
CDS
ATG
STOP
polyA
AAAAAAAAA
TTTTTTT
Signature of 3’-end
Signature of 5’-end?
GGGGGG?
Oligo
Oligo-Capping
Oligo
ATG
STOP
AAAAAAAAA
Digestion by TAP
OH
OH
H
1st Base
H
H
O
H
O
H2N
N
P
O
O-
N
O
O
O
P
O
P
O
O
H
O-
O-
H
2nd Base
H
H
O
OH
Cap structure
HN
N
O
P
O
O
O-
O
H
H
O
OH
3rd Base
H
TAP
O
H
P
O
O
O
-
H
H
O
OH
H
OH
OH
H
1st Base
H
H
O
H
O
N
N
P
O-
O
O
O
H2N
H
O
P
O-
O
P
O
O
O-
H
H
O
OH
2nd Base
H
H
HN
N
O
O
P
O
O
O-
H
H
O
OH
3rd Base
H
O
H
P
O
O
O-
H
H
O
OH
H
H
Construction of Full-Length
Enriched cDNA Library
polyA+ RNA
G
P P P mRNA AAAAA
P mRNA AAAAA
HO mRNA AAAAA
“Oligo-Capping” Procedure
G
5’-oligo
P P P mRNA AAAAA
P mRNA AAAAA
mRNA AAAAA
HO mRNA AAAAA
HO mRNA AAAAA
HO mRNA AAAAA
HO mRNA AAAAA
HO mRNA AAAAA
BAP Reaction
1st Strand Synthesis
Alkaline Degradation
TAP Reaction
5’-oligo
mRNA
AAAAA
TTTTT
TTTTT
SfiI Digestion
AAAAA
TTTTT
Vector Ligation
AAAAA
TTTTT
Suzuki et al. Gene 200: 149-156 (1997)
RNA Ligation
AAAAA
TTTTT
PCR
P mRNA AAAAA
Full-Length Enriched Library
Conventional EST vs Full-length cDNA library
EF-2 mRNA
ATG
- 85
STOP
1
2577
“Oligo-Capped” Clones
“Full” clones
“Not-Full” clones
Public Clones
AAAAA
3075
(bp)
Vector trapper
Full length cDNA library construction technology
Vector-Capping
Method
The new full-length cDNA library
construction technology
Full-length ratio 95% or more
From the collaborative research with Dr. Kato (Research
Institute, National Rehabilitation Center for Persons with
Disabilities, Japan), we developed a new method for
constructing a full-length cDNA library.
DNA Research Vol.12,No1,1-10(2005)
(registered patent:WO 2004/087916 A1)
Hitachi High-Tech Science Systems Co.
Vector-Capping
Method
Full length cDNA library construction technology
1)annealing and synthesizing first-strand cDNA
m7GpppN
mRNA
AAAA
TTTT
m7GpppN
Vector primer
AAAA
TTTT
Reverse transcriptase
AAAA
TTTT
m7GpppN
CN
2)circularization of a cDNA-vector primer duplex
N
CN
3)Second-strand synthesis
G
C
・T4 RNA ligase
・RNaseH
・DNA ligase
・DNA polymeraseⅠ
Hitachi High-Tech Science Systems Co.
Vector-Capping
Full length cDNA library construction technology
Method
Advantages
■High frequency of full-length cDNA clones
■Intactness of cDNA is assured
■PCR is not needed
(PCR process generate mutations or bias)
■Long-sized full-length cDNA can be cloned
■Several micrograms of total RNA is sufficient for
>105 independent clones
Hitachi High-Tech Science Systems Co.
Smart system
QuickTimeý Dz
TIFFÅiLZWÅj êLí£ÉvÉçÉOÉâÉÄ
ǙDZÇÃÉsÉNÉ`ÉÉǾå©ÇÈÇžÇ ½Ç…ÇÕïKóvÇ­Ç•
ÅB
mRNA start site
Promoter region
Genomic DNA
ATG
STOP
Trancription
Cap Structure
Intron
Exon
Exon
Intron
ATG
Intron
Exon
Poly Adenylation
Intron
Exon
STOP
Exon
Splicing
AAAAAAA
Premature mRNA
ATG
STOP
AAAAAAA
Mature mRNA
ATG
STOP
AAAAAAA
Mature mRNA
Nucleus
Cytoplasm
Translation
M
Z
Protein
Drawback of conventional EST
CAP 5’UTR
3’UTR
CDS
ATG
STOP
polyA
AAAAAAAAA
TTTTTTT
TTTTTTT
5’end full?
TTTTTTT
TTTTTTT
TTTTTTT
TTTTTTT
Sequence from the 5’-end
Sequence from the 3’-end
History of Full-malaria
1997 Production of XPFn:P. falciparum 3D7
cultured parasites
2001 Full-malaria
2003 Production of XPYs, XPYw: P. yoelii
propagated in mice
2005 Production of XPBb in expression vector
propagated in mice
screening of DNA vaccine
2006 Production of XPVi
patient blood
QuickTimeý Dz
TIFFÅiLZWÅj êLí£ÉvÉçÉOÉâÉÄ
ǙDZÇÃÉsÉNÉ`ÉÉǾå©ÇÈÇž ǽDžÇÕïKóvÇ­Ç•
ÅB
Full-Malaria Database web site frow
Search
Zoom
Zoom
QuickTimeý Dz
TIFFÅiLZWÅj êLí£ÉvÉçÉOÉâÉÄ
ǙDZÇÃÉsÉNÉ`ÉÉǾ å©ÇÈǞǽ Ç…ÇÕïKóvÇ­Ç•
ÅB
Full-Malaria zoom item
Zoom
Zoom
Blat result view. Annotated gene analysis result
Comparative analysis (P.falciparum vs P.yoelii)
QuickTimeý Dz
TIFFÅiLZWÅj êLí£ÉvÉçÉOÉâÉÄ
ǙDZÇÃÉsÉNÉ`ÉÉǾå©ÇÈǞǽDžÇÕïKóvÇ­Ç•
ÅB
QuickTimeý Dz
TIFFÅiLZWÅj êLí£ÉvÉçÉOÉâÉÄ
ǙDZÇÃÉsÉNÉ`ÉÉǾ å©ÇÈǞǽ Ç…ÇÕïKóvÇ­Ç•
ÅB
Future Plan
1.New malaria species
2.Other life cycle stages
3.Sequencing the entire clones
4.Comparative genomics
gene structure
promoter sequence
ジオールの酸化的開環
OH
OH
H
1st Base
H
H
O
H
O
O
O
O
N
H2N
P
O
O-
N
O
P
P
O
O
H
O-
O-
H
2nd Base
H
H
O
OH
HN
N
O
NaIO4
O
P
O
O
H
O-
H
3rd Base
H
H
O
O
O
OH
P
O
O
O
H
H
O
-
H
H
O
OH
H
O
H
O
N
H 2N
N
biotin
HN
N
N
H
O
H
1st Base
H
O
H
O
O
O
O
H2N
N
P
O
-
N
O
O
P
-
O
P
O
O
H
O-
H
2nd Base
H
H
O
HN
N
O
O
P
OH
O
O
H
O-
H
3rd Base
H
H
O
O
P
OH
O
O
-
O
H
H
O
OH
H
H
G-cap法/Smart法
GP P P
RT
AAAA
TTTT
GP P P
AAAA
TTTT
CCCC
AAAA
TTTT
GGGG
CCCC
AAAA
TTTT
PCR
CAPture法
CAP binding proteinを固定したカラムで精製
Full-length cDNA libraries used for the TSS collection
Human 137 kinds of “oligo-capped” libraries
Ave. Full-length-ness = 86 %
遺伝子解析のパラダイムシフト
トランスクリプトーム解析における変数
RNAの…
DNAのどの部分が転写されるのか
配列
転写産物のどの部分がスプライスされるのか
どこの組織にいつ転写されるのか。
時空間分布
完全長cDNAのカタログ化
発現解析
細胞内ではどのように分布するのか。
量
どれぐらいの分子数転写されるのか。分解されるのか。
状態(修飾)
分解を導くタンパク質等が結合しているのか。
プロテオーム解析における変数
タンパク質の…
配列
RNAのどの部分が翻訳されるのか
(スプライスされる例も最近報告されている。)
時空間分布
どこの組織にいつ発現するのか。
細胞内ではどのように分布するのか。
量
どれぐらいの分子数発現するのか。分解されるのか。
状態(修飾)
リン酸基、アセチル基等の修飾がされているのか
部分分解、架橋を受けているのか。
マイクロアレイ
DNAチップ
SAGE
ATAC/iAFLP
情報としてのcDNA
ゲノム計画での当初の展望; ゲノム配列からの直接の遺伝子予測
ab initio 遺伝子予測
Eg) GRAIL -> GENSCAN
“タンパク質をコードする”という制約からの配列の統計的偏り
ORF: ATG~TAA/TGA/TAG
Amino acid/codon usage: 6mer frequency
バクテリアあるいは酵母等では有効
実際、これらの生物ではcDNAの解析はほとんどされていない。
(線虫~)、ヒト、マウス等では困難
イントロンが多く、長い
偽遺伝子が多い
反復配列が多い
選択的スプライシングが予測できない。
非翻訳エキソンが予測できない。
cDNA解析計画の開始
mRNAを解析する。
“完全長” cDNA
キャップ構造
ATG
5’UTR
polyA構造
AAAAAA
STOP
CDS
完全長かつ連続したCDS(タンパク質翻訳領域)
アミノ酸配列の推定
遺伝子機能の推定
遺伝子機能の実験的解析に向けた物理的遺伝子資源
完全な5’/3’UTR(タンパク質非翻訳領域)
翻訳制御・mRNA分解を制御するモチーフの探索
正確な転写開始点の同定(後述)
ゲノム上で隣接するプロモーター領域の同定
3’UTR
ダウンロード

mRNA - sanbi