spline cúbico natural (b-spline) usando cuantiles se elige un “array blanco”(“array...
Post on 11-Apr-2015
104 Views
Preview:
TRANSCRIPT
Spline cúbico natural (B-spline) usando cuantiles
Se elige un “array blanco”(“array basal”), v
Intensidad blanco: i: spot, j: array, m: nº de arrays
X puede ser R o G
Se extraen 100 percentilos para cada array (incluso el target), se desestima el resto de los datos
target
array
Se ajusta una función spline cúbica naturalsj = f(cuantil xj, cuantil v) para cada array j
Definición spline: es una función polinomial fragmentada en intervalos
S: [a,b] → Rd consite en la piezas polinómicas Pi: [ti,ti+1) → Rd
donde a = t0 < t1 < … < tk-1 = b
Spline natural: spline de grado 3 con continuidad C2. “Natural” porque:
En nuestro caso definimos al spline para el intervalo k, array j:
Se puede calcular con R o S-plus. Se minimiza:
(S-plus)
• Selección de un set invariante:– Se calcula para cada array a los rangos de
intensidad correspondientes al spot i (ria)
– Selección del set invariante:• PRDi = ( ri1 – ri2 ) / n < 0.003 ó 0.007
– Obtenemos un nuevo set y repetimos– Paramos cuando no decrece más el tamaño del
set– Se aplica spline usando como “array basal” al set
invariante
Normalización de escala
Datasets
Inspección visual
Bias global Bias local
MA plots (lymphoma)
Clasificación k-NN
Validación cruzada por “LOOCV”
•Suficientemente sensible para evaluar la pérdida de variabilidad biológica•Disponible en varios paquetes•Empíricamente aceptables•No hace suposiciones sobre la distribución•Algoritmo sencillo•Se aplico a TODOS los spots (sin selección)
•Los artefactos son más fáciles de detectar•Se incluyeron spots de baja intensidad ¡porque son importantes también!
Conclusiones
• Métodos simples mejoran los datos• Métodos dobles mejoran a los simples• IGLOESS-SLFILTERW7, ISTSPLINE-SLLOESS
y IGLOESS-SLLOESS fueron los mejores• La elección del mejor método aún depende
mucho del array (artefactos, verdaderas diferencias biológicas?)
• Normalización de escala no tiene efectos benéficos
• La normalización tiene un impacto fuerte en el subsiguiente análisis
Software
• R language
• Bioconductor http://www.bioconductor.org
• MAANOVA
• http://www.jax.org/staff/churchill/labsite/software/download.html
• tRMA http://www.pi.csiro.au/gena/tRMA
• braju http://www.maths.lth.se/help/R/aroma
top related