primers fundamento

12
Curso: Introducción a la Bioinformática Lic. en Genética Ernesto Martín Giorgio 1 Introducción al diseño de primers INTRODUCCIÓN Esta guía es una breve aproximación al diseño de primers, utilizando programas bioinformáticos y pretende dar una orientación a aquellas personas que están incursionando por primera vez en esta amplísima disciplina que es la Bioinformática. Si esta guía orienta y ayuda al científico a realizar sus propios primers o cebadores, ha logrado su cometido. En la primera parte de esta guía, revisaremos algunos conceptos generales pertinentes al diseño de primer y a la amplificación enzimática de ADN mediante PCR, y en la segunda se detalla un taller que le permitirá poner en práctica la mayoría de los conceptos revisados. PARTE I Fundamentos teóricos de la amplificación enzimática de ADN mediante la Reacción en Cadena de la Polimerasa (PCR; polymerase chain raction) La Reacción en Cadena de la Polimerasa es una técnica que ha revolucionado el modo de manipular, clonar y detectar fragmentos de ADN, lo que le ha valido a su descubridor K. B. Mullis el Premio Nobel. Después de su descubrimiento en 1983, se ha convertido en una de las técnicas básicas de Biología Molecular, ampliamente utilizada debido a su rapidez, especificidad, flexibilidad y aplicabilidad. Entre sus aplicaciones generales encontramos la generación de sondas, clonación, secuenciación, diagnóstico clínico y tipificación de individuos y microorganismos, siendo entonces muy utilizada en medicina forense y en estudios filogenéticos. Un ciclo de PCR comienza con un calentamiento inicial que desnaturaliza el ADN blanco a 94-95 °C o más. Este primer paso del ciclo dura en promedio 90 s a 3 minutos. En el proceso de desnaturalización, las dos cadenas del ADN se separan una de la otra y permiten que la matriz (“template”) se encuentre como cadena simple, necesaria para la actividad llevada a cabo por la polimerasa termoestable durante los pasos de amplificación. En el siguiente paso del ciclo, la temperatura se reduce a un valor que oscila en el rango de los 40 °C a los 60 °C. A esta temperatura, cada uno de los oligonucleótidos (primers) hibrida con la secuencia complementaria en cada una de las cadenas simples de ADN, que se han separado en el paso anterior, y sirven como cebadores para la síntesis, por la polimerasa termoestable. La síntesis de ADN se inicia cuando la temperatura de la reacción llega al valor óptimo para la actividad de la polimerasa. Para la mayoría de las polimerasas esta temperatura se encuentra en, aproximadamente los 72 °C. Luego se permite la síntesis durante 30 s a 2 min. Este paso completa un ciclo y el siguiente ciclo se inicia con el retorno a los 94-95 °C para la desnaturalización. La cantidad de amplificado resultante va a depender de la disponibilidad de sustrato para la reacción por eso, los oligonucleótidos y los desoxirribonuclótidos trifosforilados se

Upload: pmsf-soes

Post on 26-Nov-2015

127 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Primers Fundamento

Curso: Introducción a la Bioinformática

Lic. en Genética Ernesto Martín Giorgio 1

Introducción al diseño de primers INTRODUCCIÓN

Esta guía es una breve aproximación al diseño de primers, utilizando programas

bioinformáticos y pretende dar una orientación a aquellas personas que están incursionando

por primera vez en esta amplísima disciplina que es la Bioinformática. Si esta guía orienta y

ayuda al científico a realizar sus propios primers o cebadores, ha logrado su cometido.

En la primera parte de esta guía, revisaremos algunos conceptos generales pertinentes

al diseño de primer y a la amplificación enzimática de ADN mediante PCR, y en la segunda se

detalla un taller que le permitirá poner en práctica la mayoría de los conceptos revisados.

PARTE I

Fundamentos teóricos de la amplificación enzimática de ADN mediante la Reacción en

Cadena de la Polimerasa (PCR; polymerase chain raction)

La Reacción en Cadena de la Polimerasa es una técnica que ha revolucionado el modo

de manipular, clonar y detectar fragmentos de ADN, lo que le ha valido a su descubridor K. B.

Mullis el Premio Nobel. Después de su descubrimiento en 1983, se ha convertido en una de las

técnicas básicas de Biología Molecular, ampliamente utilizada debido a su rapidez,

especificidad, flexibilidad y aplicabilidad. Entre sus aplicaciones generales encontramos la

generación de sondas, clonación, secuenciación, diagnóstico clínico y tipificación de individuos

y microorganismos, siendo entonces muy utilizada en medicina forense y en estudios

filogenéticos.

Un ciclo de PCR comienza con un calentamiento inicial que desnaturaliza el ADN

blanco a 94-95 °C o más. Este primer paso del ciclo dura en promedio 90 s a 3 minutos. En el

proceso de desnaturalización, las dos cadenas del ADN se separan una de la otra y permiten

que la matriz (“template”) se encuentre como cadena simple, necesaria para la actividad

llevada a cabo por la polimerasa termoestable durante los pasos de amplificación.

En el siguiente paso del ciclo, la temperatura se reduce a un valor que oscila en el

rango de los 40 °C a los 60 °C. A esta temperatura, cada uno de los oligonucleótidos (primers)

hibrida con la secuencia complementaria en cada una de las cadenas simples de ADN, que se

han separado en el paso anterior, y sirven como cebadores para la síntesis, por la polimerasa

termoestable.

La síntesis de ADN se inicia cuando la temperatura de la reacción llega al valor óptimo

para la actividad de la polimerasa. Para la mayoría de las polimerasas esta temperatura se

encuentra en, aproximadamente los 72 °C. Luego se permite la síntesis durante 30 s a 2 min.

Este paso completa un ciclo y el siguiente ciclo se inicia con el retorno a los 94-95 °C para la

desnaturalización.

La cantidad de amplificado resultante va a depender de la disponibilidad de sustrato

para la reacción por eso, los oligonucleótidos y los desoxirribonuclótidos trifosforilados se

Page 2: Primers Fundamento

Curso: Introducción a la Bioinformática

Lic. en Genética Ernesto Martín Giorgio 2

añaden en exceso respecto al ADN a amplificar. Como es fácil inferir, la concentración de ADN,

oligonucleótidos, de y ADN polimerasa activa disminuyen después de cada ciclo debido a la

síntesis que se está produciendo por lo que la reacción lleva a un máximo de amplificación,

luego del cual el rendimiento y el número de copias obtenidas no aumentan. A esto se lo

conoce como el efecto “Platteau”.

En la reacción de PCR ideal, existen tres fragmentos de ácidos nucleicos. El fragmento

de ADN de doble cadena a ser amplificado (molécula blanco o target) y dos oligonucleótidos de

cadena simple que hibridizan en alguna región del ADN blanco (iniciadores o primers).

Además están presentes: un componente proteico (la enzima ADN polimerasa),

desoxirribonucleótidos trifosfatos (dATP, dCTP, dTTP y dGTP), buffers y sales.

Los primers se añaden en un vasto exceso comparado con el ADN blanco a ser

amplificado. Estos se hibridizan a las cadenas opuestas del blanco y se orientan enfrentándose

con sus respectivos terminales 3’, de manera tal que la síntesis llevada a cabo por la ADN

polimerasa se extiende a través de todo el segmento del ADN blanco situado entre ellos.

Recordemos que la enzima ADN polimerasa cataliza el crecimiento de cadenas de ADN nuevas

en la dirección 5’ > 3’.

La primera ronda de síntesis resulta en la generación de cadenas de ADN nuevas sin

una longitud determinada, las cuales como las cadenas parentales, se pueden hibridizar a los

primers luego de la desnaturalización e hibridización. Estos productos se acumulan con una

progresión aritmética a través de los ciclos siguientes.

Sin embargo, el segundo ciclo de desnaturalización, hibridización y síntesis, produce

dos productos de cadena simple que componen en conjunto un producto de doble cadena en

el cual posee la longitud exacta del fragmento original delimitado entre los primers. Cada

cadena de este producto discreto es complementaria a uno de los dos primers incluidos en la

reacción y puede en consecuencia participar como blanco en los ciclos subsiguientes.

Page 3: Primers Fundamento

Curso: Introducción a la Bioinformática

Lic. en Genética Ernesto Martín Giorgio 3

La cantidad de este producto se duplica con cada ciclo subsiguiente, acumulándose

exponencialmente. Así, treinta ciclos de desnaturalización, hibridización y síntesis resultan

teóricamente en un factor de amplificación de 236 veces (68 billones de copias) del producto

molecular original.

Una PCR ideal debería ser altamente específica, fiel y de gran rendimiento. Cada uno

de estos parámetros está influido por varios componentes de la propia reacción por lo que

muchos casos ajustando las condiciones para la máxima especificidad no se obtiene buen

rendimiento, o bien optimizando para la fidelidad no se obtiene buena eficiencia. En

consecuencia, cada vez que se optimiza una PCR hay que tener en cuenta distintos aspectos

que hacen que dicha reacción sea exitosa.

¿Cuáles son los factores de los que depende una PCR exitosa?

Aunque el concepto de la PCR es simple, el desarrollo de una reacción exitosa depende de

un número de factores. Algunos de ellos son:

- Diseño de los oligonucleótidos iniciadores o cebadores (primers):

El diseño cuidadoso de primers es uno de los aspectos más importantes de la PCR. Primers mal diseñados pueden amplificar otros fragmentos de ADN distintos a los buscados (amplificación inespecífica). En el diseño de los mismos algunas reglas se han demostrado como útiles, por ejemplo:

I – Cada primer individual debe contar con una longitud de 18-24 bases. II – Se debe mantener un contenido de G:C (Guanina:Citosina) entre 40 y 60 %. III – Los dos primers del par deben de tener temperatura de fusión “Tm” cercanos, dentro de los 5 °C. IV – La secuencia de los primers individuales debe iniciarse y terminarse con 1 o 2 bases púricas. V – Evitar regiones con potencialidad para formar estructuras secundarias internas. VI – Evitar poli X. VII – Secuencias adicionales pueden ser agregadas en el extremo 5’ del primer (no incluir cuando se estima la Tm del primer). VIII – Se pueden agregar degeneraciones en algunas posiciones del primer:

a - Se incrementa el riesgo de amplificación inespecífica. b - Se disminuye la concentración en la mezcla de cada uno de los primers posibles c - No se recomienda utilizar más de 64 primers diferentes en la mezcla. d - Código IUPAC/IUB:

A adenina R A o G C citosina W A o T G guanina S C o G T timidina en el ADN Y C o T Uracilo en el ARN K G o T N A o C o G o T H A o C o T; no G M A o C B C o G o T; no A V A o C o G; no T D A o G o T; no C

Page 4: Primers Fundamento

Curso: Introducción a la Bioinformática

Lic. en Genética Ernesto Martín Giorgio 4

- Concentración del Cloruro de Magnesio:

En ausencia de concentraciones adecuadas del ión Mg++ libre la ADN polimerasa es

inactiva, por lo tanto, la concentración de Magnesio es un factor crucial que afecta el

desarrollo de la PCR. Muchos de los componentes de la reacción unen Magnesio, incluyendo la

matriz de ADN, agentes quelantes presentes en la muestra (EDTA o Citrato), dNTP’s y

proteínas. Como resultado, se puede ver afectada la cantidad de Mg++ libre presente en la

reacción. Por otro lado el exceso de Mg++ disminuye la fidelidad de la enzima y puede

incrementar el nivel de amplificación no específica. Por lo tanto, para cada protocolo de

amplificación por PCR se deben optimizar las concentraciones de Cl2Mg entre los rangos de 1 a

9 mM finales (esto se logra de manera experimental comparando el nivel de amplificación

logrado con diferentes concentraciones de Mg++, proceso conocido como titulación de Mg++).

- Elección de las enzimas:

La elección de las enzimas para ser usada en PCR depende de varios factores. Entre las

ventajas obtenidas mediante la utilización de polimerasas termoestables, comúnmente Taq,

esta la habilidad de sintetizar ADN a altas temperaturas (alrededor de 72 C); las cuales

permiten principalmente la eliminación de la mayoría de las estructuras secundarias presentes

en la molécula blanco. Sin embargo, no todas las polimerasas termoestables son igualmente

eficaces a la hora de amplificar. Taq no posee la actividad correctora 3’- 5’ con lo que su tasa

de error es del orden de 10-4 errores por par de bases incorporadas, Vent del orden de 10-5 y

Pfu del orden 10-7, siempre considerando que una polimerasa normal tiene una tasa de error

de 10-6 errores por par de bases incorporadas.

- Molde de ADN:

Tendremos que cuantificar el DNA para conocer la masa de ácidos nucleicos disuelta,

además de tener indicios acerca de su pureza. Varios autores indican la cantidad de matriz de

ADN a agregar a la reacción, expresándola en micro, nano o picogramos.

Con todo, las condiciones óptimas de la PCR siempre acaban por determinarse

empíricamente.

Formación de dímeros de cebadores (“primers dimers”)

Este artificio ocurre frecuentemente como resultado del apareamiento de bases entre

dos cebadores (o eventualmente, un extremo de un cebador sobre sí mismo). Dado que la

ADN polimerasa elonga en sentido 5’ > 3’, un oligonucleótido cebador puede permitir a la

enzima que a partir de su extremo 3’ continúe polimerizando según el templado constituido

por el otro cebador.

Los dímeros ocurren frecuentemente cuando la PCR se realiza por más de 30 ciclos o

cuando la matriz está en muy baja concentración. Aunque si existe una alta

complementariedad entre los primers los primeros cambios de temperatura pueden provocar

una predominancia de éstos frente al amplicón deseado, perjudicando enormemente al

resultado de la PCR.

Page 5: Primers Fundamento

Curso: Introducción a la Bioinformática

Lic. en Genética Ernesto Martín Giorgio 5

PARTE II

Primer3

Como la PCR es una herramienta de suma importancia, a la que suelen desembocar

muchas investigaciones, es necesario conocerla y utilizarla en cada momento que sea

necesario. Aunque siempre tenemos que poner a punto una reacción de PCR antes de hacer

uso extensivo de ella, uno de los pasos fundamentales es contar con los “primers” y con las

características de los mismos. Esto nos permitirá sortear exitosamente uno de los pasos

primordiales para obtener la mejor calidad y cantidad del producto de amplificación.

Surge entonces la pregunta: si no existen primers descriptos para amplificar una región

dada… ¿cómo los podemos diseñar y analizar? Sin dudas, tendremos que recurrir a los recursos

bioinformáticos básicos, muchos de los cuales se encuentran gratuitamente en Internet.

Para diseñar y analizar un par de primers para ser usados en una reacción de PCR

contamos con varios programas. En éste sencilla guía introductoria, haremos uso de uno

denominado Primer3.

Primer3 es una aplicación que se encuentra libre para su uso en diferentes servidores

web. En esta oportunidad utilizaremos la implementación de éste programa ofrecido por la

página JustBio.com.

Este software permite especificar un gran número de variables y obtener primers

según las indicaciones solicitadas. Además permite agregar el número de acceso de la

secuencia, que se halla en las bases de datos internacionales. También permite discriminar las

regiones de la secuencia que se deben incluir, las que se deben excluir y el rango de tamaños

del producto. Por otra parte, el software incluye la posibilidad de especificar las características

mínimas de los primers deseados, como Tm, porcentaje de GC, máxima

autocomplementariedad, y otros parámetros. También presenta las mismas facilidades si se

está buscando y analizando una sonda, por ejemplo, para utilizarse en trabajos de hibridación.

Acceda al programa Primer3 en la siguiente dirección: http://www.justbio.com/. Antes de comenzar con la aplicación deberá registrarse. Luego diríjase a Hosted Tools > Primer3. Después de unos segundos se encontrará con una página web similar a la imagen siguiente:

Page 6: Primers Fundamento

Curso: Introducción a la Bioinformática

Lic. en Genética Ernesto Martín Giorgio 6

La página principal del programa consiste en un gran recuadro en blanco, en donde

debemos “pegar” la secuencia en formato FASTA.

Exactamente debajo de éste recuadro, se encuentran 3 columnas con cuadros de

marca permiten seleccionar que es lo que deseamos obtener como salida del programa.

Tildando (click) en las columnas de los extremos se obtienen cebadores, y tildando solo la

columna del centro se obtiene como salida una sonda.

Al mover la ventana del navegador hacia abajo encontrará que Primer3 cuenta con diversas secciones que le permiten controlar una amplia variedad de parámetros relacionados con el diseño de primers.

Por favor no se sienta intimidado/a por la cantidad de parámetros modificables por Primer3, la mayoría de estos son rara vez modificados, aún por los “especialistas” del diseño de primers.

Por ser este, nuestro primer acercamiento al diseño de primers mediante esta herramienta, utilizaremos un set de condiciones mínimas (por default) y la secuencia correspondiente al ARN mensajero que codifica para el gen Gurken en Drosophila melanogaster, número de acceso NM_057220.3.

Abra otra ventana y diríjase a la página del National Center for Biotechnology

Information http://www.ncbi.nlm.nih.gov. En la solapa de búsqueda cambie All Database por Nucleotide. A continuación escriba el número de acceso y oprima el botón Search. Visualice y abra la solapa de Display Settings y elija FASTA. Copie la secuencia del gen Gurken y péguela en el Box vacio del Primer3.

Page 7: Primers Fundamento

Curso: Introducción a la Bioinformática

Lic. en Genética Ernesto Martín Giorgio 7

Por defecto Primer3 tiene habilitadas las opciones de encontrar tanto un primer corriente arriba (pick left primer or use left primer below) como corriente a bajo de nuestra secuencia.

Deshabilitando cualquiera de ellas evitaremos que el programa busque el primer en cuestión. Por otra parte, si tenemos habilitadas estas opciones e ingresamos un primer en la casilla de texto justo debajo de dichas opciones, Primer3 buscará el primer recién ingresado. Por esta vez dejaremos estas opciones tal y como se encuentran.

Luego de oprimir el botón PickPrimers y esperar unos segundos, aparecerá ahora la página de resultados de Primer3:

Page 8: Primers Fundamento

Curso: Introducción a la Bioinformática

Lic. en Genética Ernesto Martín Giorgio 8

Los resultados se obtienen en pocos segundos y se presentan en una tabla, cuyo título es “Primer3 Output”. Estos incluyen un mapa de los mejores pares de oligonucleótidos (left-izquierdo, right-derecho) de acuerdo a las especificaciones dadas en el formulario. Además, y por defecto, Primer3 muestra 4 opciones de primers opcionales (en la sección “Additional Oligos”).

La posición (start), el tamaño (len), la temperatura de melting (Tm) y el porcentaje de

GC (GC%) están presentes para cada par de oligonucleótidos. Si bien, la mayoría de estos datos arrojados en la página de resultados son bastante explícitos, tal vez los más confusos sean las columnas denotadas como “any” y “3'”.

“any”: Máxima Complementariedad (o denominada Autocomplementariedad Local):

refleja el máximo alineamiento local permisible. Se toma como predictora de la tendencia de

los primers a hibridar entre ellos.

“3’“: Máxima Complementariedad 3’ (ó denominado Alineamiento Global Anclado en

3’) es un puntaje máximo permisible cuando se testea la complementariedad entre los primers

izquierdo y derecho. Se toma para predecir la probabilidad de generación de dímeros de

primers durante la reacción de PCR.

Como habrá notado el programa resulta bastante sencillo de utilizar, la clave para su utilización se encuentra en el conocimiento que tengamos acerca de los diferentes parámetros que van a guiar nuestra reacción de PCR.

La manera de operar con Primer3 es básicamente la misma para cualquiera de las

otras 70 opciones disponibles. Varíe las diferentes opciones disponibles en Primer3 y familiarícese con algunas de ellas, y aplique las diferentes “reglas” o consejos generales que se encuentran al comienzo de esta guía para el diseño de primers.

Lamentablemente no es posible asegurar con un 100% de certeza que un primer diseñado mediante una herramienta bioinformática va a ser completamente efectivo, pero sin duda le ayudará a aproximarse a la solución más óptima de una manera muy rápida y sencilla.

CODEHOP

CODEHOP (COnsensus – DEgenerate Hybrid Oligonucleotide Primers) es un programa interactivo que ha sido desarrollado para el diseño de primers degenerados provenientes de bloques conservados de aminoácidos dentro de un alineamiento múltiple de secuencias proteicas.

El programa se encuentra libre para su uso. Acceda al programa CODEHOP por medio de la siguiente dirección: http://blocks.fhcrc.org/codehop.html. Después de unos segundos se encontrará con una página web similar a la imagen siguiente:

Page 9: Primers Fundamento

Curso: Introducción a la Bioinformática

Lic. en Genética Ernesto Martín Giorgio 9

Al mover la ventana del navegador hacia abajo, encontrará algunas secciones (muchas menos en este caso) que le permitirá controlar una variedad de parámetros relacionados con el diseño de primers.

De forma similar al programa visto anteriormente, por ser este, nuestro primer acercamiento al diseño de primers degenerados mediante esta herramienta, utilizaremos un set de condiciones mínimas (por default) y las secuencia correspondientes a los ARN mensajeros que codifican para la proteína del gen Gurken en distintas especies de Drosophila. Los números de acceso son los siguientes NP_476568.2 perteneciente a D. melanogaster, XP_001962566.1 D. ananassae, XP_002018718.1 D. persimilis y XP_002132416.1 D. pseudoobscura pseudoobscura.

Abra otra ventana y diríjase a la página del National Center for Biotechnology Information http://www.ncbi.nlm.nih.gov. En la solapa de búsqueda cambie All Database por Protein. A continuación escriba el número de acceso y oprima el botón Search. Visualice la solapa de Display Settings y elija FASTA. Copie las secuencias de los genes y péguelas en un Bloc de notas.

Realice un alineamiento múltiple con estas secuencias y guarde el archivo con extensión *.clustalw. Vuelva a la página principal de CODEHOP y abra el hipervínculo Multiple Alignement Processor. Después de unos segundos se encontrará con una página web similar a la imagen siguiente:

Page 10: Primers Fundamento

Curso: Introducción a la Bioinformática

Lic. en Genética Ernesto Martín Giorgio 10

Desplazándose sobre la ventana hacia abajo se encontrará con la siguiente imagen, aquí podrá cargar la ruta de acceso de su archivo *.clustalw obtenido por medio del programa que utilizó para el alineamiento múltiple.

Una vez cargado el archivo, oprima el botón Submit, luego de unos segundos aparecerá la siguiente ventana:

Page 11: Primers Fundamento

Curso: Introducción a la Bioinformática

Lic. en Genética Ernesto Martín Giorgio 11

En esta página diríjase a la sección Primers y abra el hipervínculo CODEHOP. Este hipervínculo regresa a la ventana principal del programa y, que en este momento se encuentra cargada con los distintos blocks generados por el programa.

Luego de oprimir el botón Look for primers y esperar unos segundos, aparecerá ahora la página de resultados de CODEHOP:

Page 12: Primers Fundamento

Curso: Introducción a la Bioinformática

Lic. en Genética Ernesto Martín Giorgio 12

Los resultados se obtienen en pocos segundos. Estos incluyen el primer sentido y el antisentido, el índice de degeneración, el tamaño del core, el tamaño de clamp, la puntuación o el score y la temperatura de melting.

De igual forma que Primer3, la manera de operar con CODEHOP, es básicamente la misma para cualquiera de las otras opciones disponibles. Como podrá notarlo el programa resulta bastante sencillo de utilizar, y no se olvide que la clave para su utilización se encuentra en el conocimiento que tengamos acerca de los diferentes parámetros que van a guiar nuestra selección de los primers degenerados.

Una vez que haya obtenido sus primers, su responsabilidad final es verificar que ellos no hibridicen en cualquier parte – excepto en el lugar que Ud. quiere que hibridicen. Por lo tanto, es muy recomendable que realice un análisis BLAST, con los primers recién diseñados, de tal manera que se asegure que dichos primers no sean complementarios a ninguna de las “posibles secuencias” involucradas en su reacción de PCR (por ejemplo, vectores de clonación). La metodología para realizar dicho análisis es la misma que se sigue para cualquier análisis BLAST, para este propósito puede visitar el servidor NCBI BLAST.