deploying bigdata from zero to million of records in amazon web services
TRANSCRIPT
Implementar su Bigdata de Cero a Millones de Registros en AMAZON WEB SERVICES
Alex Coqueiro Arquitecto de Soluciones Amazon Web Services LATAM
Datos Generados
Disponible para su análisis
VOLUMEN DE DATOS
Gartner: User Survey Analysis: Key Trends Shaping the Future of Data Center Infrastructure Through 2011 IDC: Worldwide Business Analytics Software 2012–2016 Forecast and 2011 Vendor Shares
Una gran variedad de soluciones y componentes
Glacier
S3 DynamoDB
RDS
EMR
Redshift
Data Pipeline Kinesis
Cassandra CloudSearch
AML
Simplificando el procesamiento de Big Data
Ingestión Persistencia / Storage Procesamiento Visualización
Dat
os
Res
pues
tas
Tiempo
Glacier S3
DynamoDB
RDS
Kinesis
Spark Streaming
EMR Data Pipeline
Storm
Kafka
Redshift
Cassandra
CloudSearch
Kinesis Connector
Kinesis enabled app
Amazon Kinesis Lo
gs d
e Se
rvid
ores
Amazon EMR
Amazon S3 Amazon Redshift
Visualização e Análise
Caso de Uso – Análisis de logs de vuelos
Map Reduce
Parallel Copy
SQL Query
Tipos de datos para ingestión
Transaccionales – RDBMS lectura/
escritura Archivos
– Click-stream logs – Texto libre
Stream – IoT devices – Tweets
Database
Cloud Storage
Stream Storage