genome sequence

40
Genome sequence

Upload: jeri

Post on 08-Feb-2016

66 views

Category:

Documents


0 download

DESCRIPTION

Genome sequence. Genome size does not correlate well with gene number or with apparent organism complexity. Closely related organisms can have genome sizes that vary by 100x. Human genome is 30x smaller than some plant genomes. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Genome sequence

Genome sequence

Page 2: Genome sequence

Genome size does not correlate well with gene number or with apparent organism complexity

Closely related organisms can have genome sizes that vary by 100x

Human genome is 30x smaller than some plant genomes

Page 3: Genome sequence

N= ln (1-P) ln (1 - f )

Tamanho do

fragmento

clonado (pb)

Tamanho do genoma (pb)

2 X106

Bacteria

2 X107

Fungo

3 X109

mamíferos

5 X103

10 X103

20 X103

40 X103

400

200

100

50

4.000

2.000

1.000

500

600.000

300.000

150.000

75.000

Número de clones teoricamente necessários para representar o genoma

Page 4: Genome sequence
Page 5: Genome sequence

5’...ATCGGTACCAGGCTCCTCAGAGT...3’3’...TAGCCATGGTCCGAGGAGTCTCA...5’

Seqüênciamento do genoma por “shotgun”

Genoma abertoClonagem e seqüênciamento

Alinhamento dos clonesGenoma seqüênciado

Clones“shotgun”

Bioinformática

Page 6: Genome sequence

• Fragmentos de DNA ramdômicos podem ser obtidos usando o processo HydroShear (GeneMachines Inc., USA).

Construção da biblioteca shotgun

Page 7: Genome sequence

6,0

kb

1,0

1,52,0

3,0

4,05,0

7,0

11,0

• DNA sonicado para construção biblioteca shotgun

Page 8: Genome sequence

In shotgun approach, DNA is randomly broken

into fragments, and each is sequenced

w/out knowing where in the genome the

fragment comes from

Page 9: Genome sequence

Maria Aparecida Fernandez- DBC - UEM

Page 10: Genome sequence

Maria Aparecida Fernandez- DBC - UEM

1.cromossomoou cosmídeo

2.fragmentação_ enzimática_ nebulização

3.clonagem_ pUC18

ACCTGATGCCGACGGG4.seqüenciamento

5.montagem

6.finalizaçãoContig 1 Contig 2

Cosmídeo iniciador

7.anotação

retro-alimentação

Bancada Bioinformática

SEQUENCIAMENTO DE DNA

Page 11: Genome sequence

Automated DNA Sequencing

If the chain terminators are labeled instead of the primers, all four reactions can occur in the same tube.

Page 12: Genome sequence

Maria Aparecida Fernandez- DBC - UEM

SEQUENCIAMENTO DE DNA

Page 13: Genome sequence

Typical output of an automated sequencer

Page 14: Genome sequence

Maria Aparecida Fernandez- DBC - UEM

Estrutura da Rede de Computadores

Switcher

Servidor e-mail Web FTPFirewallPentium III 750 MHz

Sun 450 Enterprise4 processadores4 GB RAM300 GB HD

PC1

PC2PC3

PCn

INTERNET

Instituições participantes do projeto

Laboratório debioinformática

Page 15: Genome sequence

Montagem do genoma• Phred – identificação de bases (base calling)

e valores de qualidade• Cross-match – identificação de seqüências de

vetor• Phrap – montagem das seqüências contíguas

(contigs)• Consed – análise e edição dos contigs• Finalização – fechamento de falhas (Scaffold),

determinação de genes (BLAST/Glimmer) e anotação (Artemis/Sequin)

Page 16: Genome sequence

GENOMAS SEQUENCIADOS

Page 17: Genome sequence

Bacterial genome

Page 18: Genome sequence

Eukaryotic DNA: chromosome

Page 19: Genome sequence

Band pattern of human chromosomes

Page 20: Genome sequence

Genes in genome

Page 21: Genome sequence

The organization of genes on a human chromosome

Page 22: Genome sequence

Human genome sequence

Page 23: Genome sequence

Comparison of genomes

Page 24: Genome sequence

Dogma central da biologia molecular

DNA

Replicação do DNA

Reparo de DNA

Recombinação genética

5´ 3´ RNA

Síntese de RNA

Transcrição

Síntese protéica

Tradução

ProteínaH2N COOH

Tradução

Transcrição

Page 25: Genome sequence

GeneDefinição Molecular

Seqüência de DNA que codifica uma proteína

Não acredito que vocês estão satisfeitos com

esta definição!!!

Page 26: Genome sequence

Alguns genomas são constituídos de RNA e não de DNA.

Alguns genes produzem RNA (tRNA e rRNA) e não proteínas.

Algumas regiões não-codantes são importantes para produção de RNA e proteínas.

GeneFalhas da definição

molecular

Page 27: Genome sequence

“ Open Reading Frame” - ORF

É a seqüência de nucleotídeos que codifica os aminoácidos de uma proteína.

A definição molecular de gene é mais ampla do que apenas a seqüência codante.

Gene

Page 28: Genome sequence

Finding the regions in a DNA sequence that encode a protein:

Computer programs designed to identify ORFs

Page 29: Genome sequence

Toda seqüência de nucleotídeos necessária para a síntese de uma cadeia polipeptídica ou de RNA funcionais.

GeneDefinição molecular

atual

Page 30: Genome sequence

Regulatórias

Sítios de ligação da RNA polimerase

Sítios de ligação dos fatores transcricionais

Íntrons

Sítios de Poliadenilação - poliA

GeneRegiões não-

codantes

Page 31: Genome sequence

Promotor E1 I1 E2 I2 E3 PoliA

Interruptor do geneFatores transcricionais

RNA polimerase

Seqüência codanteATG

Seqüência não-codanteSplicing

Cauda de poliadenina

Gene

Page 32: Genome sequence

Introns can be recognized by conserved sequences at the junctions that are required

for their removal

Page 33: Genome sequence

All parts of the genome are subject to mutation, but not all parts are subject to natural selection

Sequences that do not encode protein are not under selective pressure and thus diverge more rapidly

Page 34: Genome sequence

Comparative genomics is our most powerful tool for identifying the exons of expressed

genes

Random mutations leads to extensive sequence variation between humans and mice at all sites that are NOT under selection.

Because of functional constraints, the exons in genes stand out as islands of conservation.

Page 35: Genome sequence

Distribution of sequence types in the human genome

Page 36: Genome sequence

Average human gene is about 20x larger than genes in E. coli or even in yeast

Page 37: Genome sequence

Gene density is much higher in compact yeast genome relative to human

The partly reflects the compression of gene regulatory sequences into short regions just upstream of the gene.

Human regulatory elements can be spread out over tens of 1000s of basepairs

Page 38: Genome sequence
Page 39: Genome sequence
Page 40: Genome sequence

The C. elegans genome was completed in 1998 and is predicted to contain 19,000 genes; 3x more than the unicellular eukaryote, S. cerevisiae