captura y visualización de datos abiertos para acciones ciudadanas

32
Captura y visualización de datos abiertos para acciones ciudadanas Unai Aguilera [email protected] @unaguil I Jornada de Periodismo de Datos y Open Data Universidad de Deusto, Donostia 24 de mayo de 2013

Upload: unai-aguilera

Post on 25-Jan-2015

2.452 views

Category:

Technology


1 download

DESCRIPTION

periodismo, datos, data, journalism, open data, rdf, linked data, extraction, visualization, visualización, captura

TRANSCRIPT

Page 2: Captura y visualización de datos abiertos para acciones ciudadanas

Periodismo

Recopilar

Sintetizar

Publicar

Información de actualidad

Facilitar acceso al "lector"

Page 3: Captura y visualización de datos abiertos para acciones ciudadanas

"When information was scarce, most of our efforts were devoted to hunting and gathering. Now that information is abundant, processing is more important."

Philip Meyer, Professor Emeritus, University of North Carolina at Chapel Hill

"The unifying goal is a journalistic one: providing information and analysis to help inform us all about important issues of the day."

Aron Pilhofer, New York Times

"It used to be that you would get stories by chatting to people in bars, and it still might be that you’ll do it that way sometimes. But now it’s also going to be about poring over data and equipping yourself with the tools to analyze it and picking out what’s interesting."

Tim Berners-Lee, founder of the World Wide Web

Periodismo de datos

Page 4: Captura y visualización de datos abiertos para acciones ciudadanas

Do not Harm, Las Vegas Sun (2010)http://www.lasvegassun.com/hospital-care/

2,9 millones de facturas analizadas

Detectados 3600 errores prevenibles

Resultado

6 modificaciones ley sanitaria

Page 5: Captura y visualización de datos abiertos para acciones ciudadanas

Iraq War Logs, Associated Presshttp://overview.ap.org/blog/2010/12/a-full-text-visualization-of-the-iraq-war-logs/

11,616 SIGACT informes desde diciembre 2006

Búsqueda de palabras relacionadas

Clusterización

Enfatizar visualmente la estructura

Page 6: Captura y visualización de datos abiertos para acciones ciudadanas

El indultómetro, Fundación Civiohttp://www.elindultometro.es/

Uso y posible abuso de la ley de indulto

Información del BOE desde 1996

Análisis gráfico

Tiempo medio de indulto

Histórico de indultos

Indultos destacados

Page 7: Captura y visualización de datos abiertos para acciones ciudadanas

Fuentes

Procesar

Visualizar

Flujo de trabajoSelecciónFiabilidadPre-proceso

PatronesRelacionesRazonar

ResumirFacilitarAtraer

Page 8: Captura y visualización de datos abiertos para acciones ciudadanas

¿Por dónde empezamos?

Page 9: Captura y visualización de datos abiertos para acciones ciudadanas

Catálogos de datosDatos abiertos

http://datahub.io/

http://opendata.euskadi.net/

http://datacatalogs.org/

Empresas privadas

http://datamarket.com/Datos abiertos y de pago

Google

Page 10: Captura y visualización de datos abiertos para acciones ciudadanas

Búsqueda de datosBuscador

Proceso más costoso

Conjuntos de datos duplicados

Sin catalogar

Origen dudoso

Licencias de uso

desempleo filetype:CSV

Tipo de fichero

desempleo filetype:XLS

desempleo filetype:RDF desempleo filetype:PDF

Page 11: Captura y visualización de datos abiertos para acciones ciudadanas

De personas y máquinasOrientada a personas

Representación visual (HTML + CSS)

Documentos PDF

Difíciles de procesar (PDF Miner)

API web

http://www.justizia.net/

Web scraping

Scripting

Python+Beautiful Soap

Ejemplo

https://github.com/RHoK-Bilbao/desahucios

Page 12: Captura y visualización de datos abiertos para acciones ciudadanas

Machine readable dataListado personas desaparecidas durante la Guerra Civil y el Franquismo (9600 entradas)

Fuente de datos: Justicia y Administración Pública. Gobierno Vasco

http://opendata.euskadi.net/w79-contdata/es/contenidos/ds_general/personas_desaparecidas/es_desapare/personas_desaparecidas.html

Nombre

Vecindad

Lugar muerte

Fecha muerte

Causa

Datos

¿Qué podemos preguntar?

Page 13: Captura y visualización de datos abiertos para acciones ciudadanas

Google Fusion TablesListado personas desaparecidas durante la Guerra Civil y el Franquismo (solo 300 primeras / 9600 entradas)Fuente de datos: Justicia y Administración Pública. Gobierno Vasco

Page 14: Captura y visualización de datos abiertos para acciones ciudadanas

Linked Data

Sir Tim Berners-Lee

LOD - Linked Open Data Cloud

Mecanismos básicos de la web

Aplicados a datos

HTTP -> Enlaces

URIs -> Recursos

RDF -> Estructura

http://5stardata.info/

Page 16: Captura y visualización de datos abiertos para acciones ciudadanas

Procesado de datos

Comparar

Limpieza

ClusterizaciónCurvas de ajuste

¿Qué quieres responder?

Combinar fuentes

¿Qué quieres demostrar?

¿Qué datos tienes?

Data mining

Hadoop

Page 17: Captura y visualización de datos abiertos para acciones ciudadanas

Visualización

Grandes volúmenes de datos

Facilitar comprensión

Interactividad

Razonar

Extraer conclusiones

Representación adecuada

Page 18: Captura y visualización de datos abiertos para acciones ciudadanas

Gráficos de puntos (dispersión)

Distribución de valores 2D

Conocer las ocurrencias

Agrupaciones (clusters)

No representan tendencias

Page 19: Captura y visualización de datos abiertos para acciones ciudadanas

Gráficos de líneas

Relaciones entre valores

Tendencias

Cambios temporales

No representan categorías

Page 20: Captura y visualización de datos abiertos para acciones ciudadanas

Gráficos de barras

Compara categorías

Orden de las barras

Pareto (mayor a menor)

Cronológico

Page 21: Captura y visualización de datos abiertos para acciones ciudadanas

Gráficos circulares

Proporción numérica

Problemas

Comparación áreas

Muchas categorías

Mejor gráficos de barras

Page 22: Captura y visualización de datos abiertos para acciones ciudadanas

Google Charts

https://developers.google.com/chart/

Interactivos

HTML5 + SVG

Javascript

Page 23: Captura y visualización de datos abiertos para acciones ciudadanas

NVD3.js

http://nvd3.org/

Interactivos

HTML5

Javascript

Page 24: Captura y visualización de datos abiertos para acciones ciudadanas

D3.js

http://d3js.org/

Interactivos

HTML5

Javascript

Complementamente Excesivamente configurables

Page 25: Captura y visualización de datos abiertos para acciones ciudadanas

Geolocalización

¡Cuidado con las licencias de uso!

Page 26: Captura y visualización de datos abiertos para acciones ciudadanas

Visualización++

Information is Beautiful

Ideas para visualización

Figuras estáticas

Usar otras aplicaciones

http://www.informationisbeautiful.net/

Page 27: Captura y visualización de datos abiertos para acciones ciudadanas

Proyecto LinkedStats

Mapa de calor (OpenLayers)

Kg residuos/persona

Progresión temporal

Gráficas por municipio (NVD3.JS)

Datos utilizados

ResiduosDiputación de Bizkaia(PDF Scraping)Copy & Paste - ing

PoblaciónINS(Fichero CSV)

http://helheim.deusto.es/linkedstats/

Autor

Jon Lázaro

Page 28: Captura y visualización de datos abiertos para acciones ciudadanas

Conclusiones

Oportunidad de trabajo

Periodistas, ingenieros, diseñadores, ...

Conciencia social

Grupos interdisciplinares

Page 32: Captura y visualización de datos abiertos para acciones ciudadanas

Referencias

European Public Data Show Casehttp://publicdata.eu/

http://datajournalismhandbook.orgData Journalism Handbook

Licencia Creative Commons

Now You See It: Simple Visualization Techniques for Quantitative Analysis

Python Programming Languagehttp://python.org/