The next generation sequencing - UNESP · Sequenciamento de próxima geração 1 - melhor...
Transcript of The next generation sequencing - UNESP · Sequenciamento de próxima geração 1 - melhor...
9/7/2013
1
The next generation sequencing
Cesar Martins ([email protected])Departamento de MorfologiaInstituto de Biociências , UNESP Universidade Estadual PaulistaBotucatu, SP
9/7/2013
2
Métodos AtuaisSequenciamento de próxima geração
1 - melhor custo-benefício para projetos de alta demanda de dados;
2 custo por bp muito menor;
3 sequenciamento muito mais rápido e eficiente (> 40 Gbase/corrida).
4 versatilidade Genomas, expressão gênica, diagnóstico, gen.
população, epigenética, metagenômica, entre outros
Análise genômica 2013
The next generation technologies
Roche 454
Solid
Illumina/Solexa
Ion Torrent
PacBio
Nanopore
Sequenciamento de segunda geração
Sequenciamento de terceira geração
Sequenciamento de quarta geração
Análise genômica 2013
9/7/2013
3
5.292,39
0,09
-500,00
500,00
1.500,00
2.500,00
3.500,00
4.500,00
5.500,00
Sep
tem
ber
-20
01
Mar
ch-2
00
2
Sep
tem
ber
-20
02
Mar
ch-2
00
3
Oct
ob
er-2
00
3
Jan
uar
y-2
00
4
Ap
ril-
20
04
July
-20
04
Oct
ob
er-2
00
4
Jan
uar
y-2
00
5
Ap
ril-
20
05
July
-20
05
Oct
ob
er-2
00
5
Jan
uar
y-2
00
6
Ap
ril-
20
06
July
-20
06
Oct
ob
er-2
00
6
Jan
uar
y-2
00
7
Ap
ril-
20
07
July
-20
07
Oct
ob
er-2
00
7
Jan
uar
y-2
00
8
Ap
ril-
20
08
July
-20
08
Oct
ob
er-2
00
8
Jan
uar
y-2
00
9
Ap
ril-
20
09
July
-20
09
Oct
ob
er-2
00
9
Jan
uar
y-2
01
0
Ap
ril-
20
10
July
-20
10
Oct
ob
er-2
01
0
Jan
uar
y-2
01
1
Ap
ril-
20
11
July
-20
11
Jan
-20
12
(EST
)
http://genome.gov/splash.htm
CUSTO DO SEQUENCIAMENTO POR BASE
Roche 454 Illumina
Solid e Helicos
Análise genômica 2013
95.263.072
7.950
0
10.000.000
20.000.000
30.000.000
40.000.000
50.000.000
60.000.000
70.000.000
80.000.000
90.000.000
100.000.000
Sep
tem
ber
-20
01
Mar
ch-2
00
2
Sep
tem
ber
-20
02
Mar
ch-2
00
3
Oct
ob
er-2
00
3
Jan
uar
y-2
00
4
Ap
ril-
20
04
July
-20
04
Oct
ob
er-2
00
4
Jan
uar
y-2
00
5
Ap
ril-
20
05
July
-20
05
Oct
ob
er-2
00
5
Jan
uar
y-2
00
6
Ap
ril-
20
06
July
-20
06
Oct
ob
er-2
00
6
Jan
uar
y-2
00
7
Ap
ril-
20
07
July
-20
07
Oct
ob
er-2
00
7
Jan
uar
y-2
00
8
Ap
ril-
20
08
July
-20
08
Oct
ob
er-2
00
8
Jan
uar
y-2
00
9
Ap
ril-
20
09
July
-20
09
Oct
ob
er-2
00
9
Jan
uar
y-2
01
0
Ap
ril-
20
10
July
-20
10
Oct
ob
er-2
01
0
Jan
uar
y-2
01
1
Ap
ril-
20
11
July
-20
11
Jan
-20
12
(EST
)
Genoma humano U$ 2 bi; ~3 bilhões bp; 11 anos; ~12X
Genoma U$ 2.500,00; ~1 bilhão bp; alguns dias; ~40X
CUSTO DO SEQUENCIAMENTO POR GENOMA
http://genome.gov/splash.htm
Roche 454 Illumina
Solid e Helicos
9/7/2013
4
e on DNA sequencing technology. Natur e, 2011.
sequ en cia men t o de DN A
Mardis. Science 2011
100 Gbase
Análise genômica 2013
Illumina HiSeq: 600 Gb
Análise genômica 2013
9/7/2013
5
Kahn SD. Science 2011
Análise genômica 2013
Genoma humano - ~3 bilhões x 1= ~800 Alberts, 10 anos
Genoma da tilápia- ~1 bilhão x 40= ~40 bilhões = ~10.600 Alberts, alguns
dias
Antes e hoje
Análise genômica 2013
9/7/2013
6
Objetivo rastrear as variações genéticas em populações humanas
Objetivo gerar conhecimento sobre o genoma de câncer com o intuito de
gerar tratamentos e diagnósticos
Hoje
Análise genômica 2013
Objetivo analisar o genoma de 10 mil espécies de vertebrados
Hoje
Objetivo analisar o genoma de 5 mil espécies de insetos e outros
artrópodos
Análise genômica 2013
9/7/2013
7
Maiores problemas dos sequenciamentos em
larga escala!!!
Estocagem
Montagem
Análise
Análise genômica 2013
454 Roche
Vídeohttp://www.wellcome.ac.uk/Education-resources/Teaching-and-education/Animations/DNA/WTX056046.htm
Illumina
Vídeohttp://www.wellcome.ac.uk/Education-resources/Teaching-and-education/Animations/DNA/WTX056051.htm
Análise genômica 2013
9/7/2013
8
Sequenciamento de segunda geração
Roche 454
Solid
Illumina/Solexa
Ion Torrent
Análise genômica 2013
Análise genômica 2013
2004-2005Roche 454 Life science
Utiliza tecnologia de pirosequenciamento - 1986
Roche 454 2nd generation
9/7/2013
9
Análise genômica 2013
Princípio
Mecanismo do Pirosequenciamento
ATP-sulfurilase Conversão PPi ATP
Luciferase Usa ATP p/ converter luciferina oxyluciferina = LUZApirase degrada os ATPs e nucleotideos livres
9/7/2013
10
Zhou et al., 2010. Protein Cell
http://www.youtube.com/watch?v=bFNjxKHP8Jchttp://www.youtube.com/watch?v=JNqXgLKOzKU
Biotin tag
Streptavidin
Análise genômica 2013
Análise genômica 2013
9/7/2013
11
Análise genômica 2013
Amplificação maciça utilizandouma emulsão com milhares de beads de agarose, com primers ancoradores aos adapt. A reaçãode PCR é realizada e o sequen. ocorre na placa PTP (picotiteplate).
Roche GS FLX System
Análise genômica 2013
9/7/2013
12
Análise genômica 2013
SOLiDLife Technologies
Emulsion PCR
132 Overview of Sequencing Technology Platforms
which the sequencing reactions begin. These high-throughput sequencing systems,
with the exception of PacBio RS, require cation of the sequencing library
DNA to form spatially distinct and detectable sequencing features (Fig. 2.3 ).
cation can be performed in situ, in emulsion or in solution to generate clus-
ters of clonal DNA copies. Sequencing is performed using either DNA polymerase
synthesis for uorescent nucleotides or the ligation of uorescent oligonucleotides
(Fig. 2.4 ).
The high-throughput sequencing platforms integrate a variety of uidic and optic
technologies to perform and monitor the molecular sequencing reactions. The uidics
systems that enable the parallelization of the sequencing reaction form the core of the
high-throughput sequencing platform. Micro-liter scale uidic devices support the
DNA immobilization and sequencing using automated liquid dispensing mecha-
nisms. These instruments enable the automated ow of reagents onto the immobilized
Fig. 2.3 Generation of sequencing features. High-throughput sequencing systems have taken
different approaches in the generation of the detectable sequencing features. ( a ) Emulsion PCR is
applied in the GS FLX and SOLiD systems. Single enrichment bead and sequencing library fragment
are ed inside an aqueous reaction bubble. PCR is then applied to populate the surface of
the bead by clonal copies of the template. Beads with immobilized clonal DNA collections are
deposited onto a Picotiter plate (GS FLX) or on a glass slide (SOLiD). ( b ) Bridge-PCR is used
to generate the in situ clusters of ed sequencing library fragments on a solid support.
Immobilized cation primers are used in the process. ( c ) Rolling circle cation is used
to generate long stretches of DNA that fold into nanoballs that are arrayed in the CGA technology.
( d ) Biotinylated DNA polymerase binds to bubble adapted template in the PacBio RS system.
Polymerase/template complex is immobilized on the bottom of a zero mode w ave guide (ZMW)
P1 and P2adaptors
http://gtc.soe.ucsc.edu/content/solid-technology-overview
SOLiDLife Technologies
Análise genômica 2013
9/7/2013
18
ION TORRENT
Não utiliza scanere câmeras
Análise genômica 2013
Ion PGMTM Sequencer Ion ProtonTM Sequencer
9/7/2013
19
1 dNTP de cada vezñ utiliza nucleotídeos modificados e cascatas enzimáticasñ utiliza detecção óptica (fluorescência e
quimioluminescência)
Chip: Array of microwells
DETECÇÃO DO SINAL
Chip: Array of microwells
Análise genômica 2013
9/7/2013
20
DETECÇÃO DO SINAL
ISFET Ion Sensitive Field-Effect Transistor
DETECÇÃO DO SINAL
Análise genômica 2013
9/7/2013
21
http://www.youtube.com/user/iontorrent
DETECÇÃO DO SINAL
Análise genômica 2013
PacBio RS sequencerSequenciamento de terceira geração
9/7/2013
23
Constituintes Principais
Camada lipídica
Análise genômica 2013
Constituintes Principais
Exonuclease
Análise genômica 2013
9/7/2013
24
Métodos do futuro próximo
Oxford NanoporeTechnologies, based in Oxford, UK expects to start selling its new machine in the second half of this year and also plans to launch the
sequencer the MinION which will retail for less than US$900.
Análise genômica 2013
Análise genômica 2013
9/7/2013
25
Comparação diferenttes plataformas
Plataf. Comp
(bp)
Tempo
de
corrida
(dias)
Gb por corrida Prós Contras
FLX
500-1kb 0,35 0,45 Reads longos;
agilidade
Alto custo dos
reagentes; alto erro
*Illumina 100-150 9 35 Plataforma mais
utilizada
Baixa capacidade
multiplexar
amostras
SOLiD 3 50 14 50 Sistema de correção
de erros
Demora na corrida
PacificBioscience 3-20kb ? ? Reads mais longos Alto erro
Nanopore 100kb 15 min ? Reads mais longos Alto erro
* HiSeq2000 gera um output com 600 Gb por corrida. Maior output atual.
Análise genômica 2013
...5ª geração, quando será que sai??!!
Sequenciamento de próxima geração, 2ª, 3ª, 4ª
geração!!!! AHHHHHH... Assim eu não aguento!!!
Análise genômica 2013