Genome-wide association studies (GWAS)
Gerson A Oliveira Junior
gjunior@usp. br Médico Veterinário – Doutorando
Faculdade de Zootecnia e Engenharia de Alimentos/USP
Grupo de Melhoramento Animal e Biotecnologias (GMAB)
Marcador Molecular
Genoma é composto por ≈ 3,000,000,000 par de bases
O que são SNPs?
Single base pairs substitutions create SNPs
O que são SNPs?
There are around 73,000,000 SNPs in the human genome
O que são SNPs?
Some traits are associated with few SNPs
Some traits are associated with many SNPs
O que são SNPs?
Most SNPs don’t have association with any trait!
O que são SNPs?
SNP chips
Espécie Densidade Chip (SNP)
Humanos 3.000.000
Bovinos 750.000
Cachorro 250.000
Ovinos 56.000
Suínos 60.000
Equinos 55.000
Aves 600.000
We need variation: Association Phenotype and Genotype
AB AB AB AB
AB BB BB AA
AB
BB
GWAS
Linkage Desequelibrium
• Conceito Estatístico
• Descreve associações não aleatórias entre alelos de diferentes loci
• Loci em LD estão normalmente próximos
• Auxilia a mapear genes
GWAS
• Descoberto a sete anos (WTCCC, 2007) • O objetivo é detectar variações no genoma (SNP)
que estão associadas com características de interesse ou doenças
• Está sendo implementado para características controladas por poucos genes (Blasco e Toro, 2014; Hayes et al., 2009)
• Tem como base o LD entre SNPs genotipados e uma variação causal não genotipada
• ↓MAF <> ↓ LD
GWAS
• Doenças – autoimunes
– Câncer
– Diabetes
– Doenças poligênicas
– OCD (Tang et al.)
• Existe mais de 2.000 loci associados com características poligênicas (complex traits)Link
Visscher et al., 2012
Diferentes usos
• Marker-Assisted Selection (MAS) • Gene de efeito maior (Halotano)
• LD
• ↓Variabilidade (complex traits)
• Genomic Selection (Meuwissen et al., 2001) • > variabilidade genética
• < viés de eleger marcadores + significativos
• pressupões que todos SNPs estão em LD com algum QTL
• População referência • Fenótipos e genótipos
• Predizer valores genético genômicos (GEBV)
• População teste
• Predizer GEBV para animais jovens, sem fenótipo
• << intervalo de gerações
• > ganho genético anual (2x)
• Endogamia
• Populações devem ser relacioandas
GS
Hayes and Goddard, 2010
GS
• Características caras e difíceis de mensurar
• LD ~ gerações (< acurácia)
• Nova pop. Treinamento
• < interessante
• Quantos SNP usar para Seleção Genômica?
– custo mais acessível com decorrer dos anos
– ↓LD ↑SNP (Hayes e Goddard, 2010)
– r² > 0,2 em janelas de 100 kb (Calus et al.,2008)
– 30,000 ??
– ↑ Ne ↑ SNP
– Sequenciamento x 150K (Van Raden et al., 2011)
GWAS
• Problemas:
Características controlados por vários genes de efeitos pequenos
Teste estatísticos pouco robustos
LD com genes causais ( um SNP pode estar em LD com um gene que está em outro cromossomo)
Não explica grande parte da variabilidade genética da população (missing heritability)
Diferença entre populações
Endogamia
OBRIGADO ! [email protected]