inteligencia de datos y big data - acaingpba.org.ar de datos y big data.pdf · inteligencia de...
TRANSCRIPT
![Page 1: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/1.jpg)
Inteligencia de Datos y
Big Data
Disertantes: Dra. Laura Lanzarini – Dr. Waldo Hasperué
![Page 2: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/2.jpg)
Agenda
1. Aspectos generales
2. Inteligencia de Datos en la industria.
3. Aplicaciones desarrolladas
4. Formación de RRHH
5. Conclusiones
![Page 3: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/3.jpg)
Los avances tecnológicos hacen que las
capacidades para generar y almacenar
datos se incrementen día a día.
Inteligencia de Datos
La inteligencia de Datos engloba herramientas y
actividades analíticas capaces de mejorar la comprensión
de los datos extrayendo su valor y significado para
promover una mejor toma de decisiones.
![Page 4: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/4.jpg)
Fuentes de Datos
![Page 5: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/5.jpg)
Empresas que analizan imágenes
Pinterest incorporó VisualGraph
Empresa Vicarious : Inversores Mark Zuckerberg (Facebook), Elon Musk (cofundador de PayPal) buscan determinar las “relaciones de causa y efecto”.
2.300 millones de usuarios activos en Facebook generando muchos datos.
(Fuente: Data Never Sleeps 2019)
Detector de personas Detector de bolsos Detector de faldas
https://techcrunch.com
![Page 6: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/6.jpg)
Seguimiento de sus redes sociales para saber
quién está consumiendo sus bebidas
dónde están sus clientes
qué situaciones los incitan a hablar sobre su marca
Identifica sus productos en fotografías y determina cuando enviar publicidad
Ahora buscan usar bots para generar anuncios
www.adweek.com
![Page 7: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/7.jpg)
El 90% de todos los datos fueron creados en los últimos dos años (Fuente: IBM 2017)
Monetización de los datos. Usando Big Data, Netflix ahorra mil millones de dólares al
año en la retención de clientes.
Desde 2012, el BD ha creado 8 millones de puestos de trabajo sólo en los EE.UU. y 6
millones más en todo el mundo.
Forbes - Shutterstock
![Page 8: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/8.jpg)
Big Data – Las 5 Vs
VelocidadProcesamientoBatch / Streaming
ValorValor agregado
Información útilConocimiento
VeracidadAutenticidadOrigen, reputaciónDisponibilidad
VariedadEstructurado (BBDD relac.)No Estructurado (ej: Imágenes, logs, audios)Semi-estructurados (ej: HTML, XML)
VolumenTerabytes / PetabytesExabytes / Zettabytes
Ej: Twitter 12TB x día
(500 mil tweets x min)
![Page 9: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/9.jpg)
Extracción de conocimiento
Fayyad (1996)
![Page 10: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/10.jpg)
Extracción de conocimiento
Generalmente registrado en forma previa al proceso de KDD.
Almacena información histórica
No necesariamente centralizada
Fayyad (1996)
![Page 11: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/11.jpg)
Extracción de conocimiento
Elegidos en base al problema
Medidas subjetivas y objetivas
Fayyad (1996)
![Page 12: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/12.jpg)
Extracción de conocimiento
Uniformar la notación.
Datos faltantes
Fuera de los rangos esperados (outliers)
Fayyad (1996)
![Page 13: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/13.jpg)
Extracción de conocimiento
Fayyad (1996)
![Page 14: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/14.jpg)
Extracción de conocimiento
Inteligencia de negocios
Operaciones de negocios
![Page 15: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/15.jpg)
Inteligencia de Datos en la industria
![Page 16: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/16.jpg)
Obtención de Datos en una planta
PapelErrores de registro
Errores de procesamiento
Información descentralizada
Planillas de cálculoErrores de tipeoMenos errores de procesamientoInformación descentralizada
ERPErrores de tipeoSin errores de procesamientoInformación centralizada
IIoTSin errores en la carga de datosSin errores de procesamientoInformación centralizada
Captura en el centro de
producción.
Rápido procesamiento.
Información fiable y
objetiva para toda la
organización
![Page 17: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/17.jpg)
Industrias que adoptaron IoT
Top 7 de las industrias que adoptaron IoT
Salud
Ciudades inteligentes
Transporte
FabricaciónEnergía
Cadena de
suministros
Agricultura
https://flespi.com
![Page 18: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/18.jpg)
Siemens incorporó el análisis predictivo
Objetivo: optimizar el funcionamiento, comprender y
predecir los incidentes, sobre las turbinas industriales a gas.
5000 sensores por turbina
generando 1 dato/seg. (432
millones x dia)
Mantenimiento predictivo (Correlaciones entre datos recolectados,
datos operacionales y medidas manuales)
Big Data: proc.10 TB x seg (batch)
Alineación de datos temporales.
Uso de marcas temporales
www.decideo.com
![Page 19: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/19.jpg)
Sector aeroespacial
![Page 20: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/20.jpg)
Autos inteligentes
Sensor LIDAR con 32 o 64 pulsos de
láser para construir un modelo 3D del
entorno en un rango de 200 m.
![Page 21: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/21.jpg)
Gemelos digitales
www.plm.automation.siemens.com
Tipos de gemelos
digitales
Producto
Producción
Rendimiento
Son una representación virtual de un producto o proceso físico.
Usados para simular, predecir y optimizar el producto y el sistema
de producción antes de invertir en prototipos y activos físicos.
![Page 22: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/22.jpg)
APLICACIONES DESARROLLADAS
![Page 23: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/23.jpg)
Asignación de móviles en emergencias
médicas
Buscar imágenes de la tesis de Javier López
OBJETIVOS
Ubicación de la prestación
Tiempo de llegada
Categoría de la prestación
Afinidad médico y móvil/prestación
Uso uniforme de recursos
![Page 24: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/24.jpg)
Extracción de reglas de clasificación
Características
Obtiene reglas de clasificación del tipo IF-THEN sencillas, de baja cardinalidad, con una tasa de acierto aceptable.
Se lo midió sobre 12 BBDD de repositorio y 3 BBDD reales del
Sistema Financiero Ecuatoriano.
![Page 25: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/25.jpg)
Diagnóstico de alteraciones del equilibrio
Funcionando en consultorio.
Realiza un prediagnóstico
en forma automática.
Registro de software
![Page 26: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/26.jpg)
Reconocimiento de voz
Voces de 30 locutores durante 20 seg. para entrenar.
Cada segmento de audio se representa por una secuencia de coef. ceptrales
Se usaron intervalos de 20 ms con superposición de 10 ms.
La red usa un sistema de votación para responder.
Voz MFCC SOM
Base de Datosde Voz
CoeficientesCesptrales
SOM Dinámico
Modelo
Modelo de Decisión
![Page 27: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/27.jpg)
Detección temprana de demencia
Luis Guerra et al.(2018). The Electroencephalogram as a Biomarker Based on Signal
Processing Using Nonlinear Techniques to Detect Dementia. In: Developments and
Advances in Defense and Security. MICRADS 2018. Smart Innovation, Systems and
Technologies, vol 94. Springer.
https://doi.org/10.1007/978-3-319-78605-6_11
![Page 28: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/28.jpg)
Reconocimiento de gestos dinámicos
![Page 29: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/29.jpg)
Reconocimiento de Lengua de Señas
![Page 30: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/30.jpg)
Reconocimiento de Lengua de Señas
![Page 31: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/31.jpg)
Reconocimiento de Lengua de Señas
![Page 32: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/32.jpg)
Redes Neuronales Convolucionales
Sana: 0.1
Rota:1.0
![Page 33: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/33.jpg)
Expresiones faciales en pacientes con Alzheimer
Castillo-Salazar D. et al. (2020) Detection and Classification of Facial Features Through
the Use of Convolutional Neural Networks (CNN) in Alzheimer Patients. In: Human
Systems Engineering and Design II. IHSED 2019. Advances in Intelligent Systems and Computing, vol 1026. Springer.
https://doi.org/10.1007/978-3-030-27928-8_94
![Page 34: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/34.jpg)
Formación de RRHH
![Page 35: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/35.jpg)
Científico de Datos (Data Scientist)
Diagrama de Venn del “Científico de datos”
(Fuente: Drew Conway)
En 2012, el artículo de Harvard
Business Review citó al Data
Scientist como el "trabajo más
sexy del siglo XXI"
![Page 36: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/36.jpg)
Formación de RRHH
POSGRADO
Maestría y Especialización en Inteligencia de Datos orientada a Big Data.
Cuerpo Académico: 13 doctores, 4 magisters y 2 especialistas.
Cursos de posgrado válidos para el Doctorado en Ciencias Informáticas.
GRADO
Cursos de grado – Optativas de las carreras Ingeniería en Computación,
Lic. en Informática y Lic. en Sistemas.
TESIS FINALIZADAS (2012-2020)
9 tesis de Doctorado
1 tesis de Magister
4 tesis de Especialista
15 tesinas de grado
BECARIOS Y TESISTAS
1 becario posdoctoral UNLP
2 becarios doctorales UNLP
1 becario EVC - CIN
1 becario - Fac.Informática
Tesistas de postgrado externos
![Page 37: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/37.jpg)
Conclusiones
La Inteligencia de Datos como herramienta para
obtener conocimiento a partir de los datos se ha
consolidado.
La estadística y la matemática son factores centrales
para trabajar en estos temas.
Los datos deben ser utilizados no sólo para explicar la
realidad sino para anticipar situaciones o
comportamientos.
![Page 38: Inteligencia de Datos y Big Data - acaingpba.org.ar de Datos y Big Data.pdf · Inteligencia de Datos La inteligencia de Datos engloba herramientas y actividades analíticas capaces](https://reader030.vdocument.in/reader030/viewer/2022040309/5f26a84e3e469214a25214c4/html5/thumbnails/38.jpg)
Contactos
Laura Lanzarini
Waldo Hasperué
¿Preguntas?