spline cúbico natural (b-spline) usando cuantiles se elige un “array blanco”(“array...

Post on 11-Apr-2015

104 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Spline cúbico natural (B-spline) usando cuantiles

Se elige un “array blanco”(“array basal”), v

Intensidad blanco: i: spot, j: array, m: nº de arrays

X puede ser R o G

Se extraen 100 percentilos para cada array (incluso el target), se desestima el resto de los datos

target

array

Se ajusta una función spline cúbica naturalsj = f(cuantil xj, cuantil v) para cada array j

Definición spline: es una función polinomial fragmentada en intervalos

S: [a,b] → Rd consite en la piezas polinómicas Pi: [ti,ti+1) → Rd

donde a = t0 < t1 < … < tk-1 = b

Spline natural: spline de grado 3 con continuidad C2. “Natural” porque:

En nuestro caso definimos al spline para el intervalo k, array j:

Se puede calcular con R o S-plus. Se minimiza:

(S-plus)

• Selección de un set invariante:– Se calcula para cada array a los rangos de

intensidad correspondientes al spot i (ria)

– Selección del set invariante:• PRDi = ( ri1 – ri2 ) / n < 0.003 ó 0.007

– Obtenemos un nuevo set y repetimos– Paramos cuando no decrece más el tamaño del

set– Se aplica spline usando como “array basal” al set

invariante

Normalización de escala

Datasets

Inspección visual

Bias global Bias local

MA plots (lymphoma)

Clasificación k-NN

Validación cruzada por “LOOCV”

•Suficientemente sensible para evaluar la pérdida de variabilidad biológica•Disponible en varios paquetes•Empíricamente aceptables•No hace suposiciones sobre la distribución•Algoritmo sencillo•Se aplico a TODOS los spots (sin selección)

•Los artefactos son más fáciles de detectar•Se incluyeron spots de baja intensidad ¡porque son importantes también!

Conclusiones

• Métodos simples mejoran los datos• Métodos dobles mejoran a los simples• IGLOESS-SLFILTERW7, ISTSPLINE-SLLOESS

y IGLOESS-SLLOESS fueron los mejores• La elección del mejor método aún depende

mucho del array (artefactos, verdaderas diferencias biológicas?)

• Normalización de escala no tiene efectos benéficos

• La normalización tiene un impacto fuerte en el subsiguiente análisis

Software

• R language

• Bioconductor http://www.bioconductor.org

• MAANOVA

• http://www.jax.org/staff/churchill/labsite/software/download.html

• tRMA http://www.pi.csiro.au/gena/tRMA

• braju http://www.maths.lth.se/help/R/aroma

top related