llg data journalism module3 review

17
MODULE 3 REVIEW FINDING STORY IDEA WITH DATA ANALYSIS 뉴스젤리 김재옥

Upload: neuro-associates

Post on 01-Jul-2015

149 views

Category:

Data & Analytics


8 download

DESCRIPTION

LLG Data Journalism Module3 Review

TRANSCRIPT

Page 1: LLG Data Journalism Module3 Review

MODULE 3 REVIEW

FINDING STORY IDEA

WITH DATA ANALYSIS

뉴스젤리김재옥

Page 2: LLG Data Journalism Module3 Review

목차

1. 개념소개

2. 분석툴

3. 데이터분석사례

Page 3: LLG Data Journalism Module3 Review

1. 개념소개

Page 4: LLG Data Journalism Module3 Review

스토리를위한..

•패턴 (PATTERN)

•아웃라이어 (OUTLIER)

1. 개념소개

Page 5: LLG Data Journalism Module3 Review

•증감률

•비율

•평균 VS 중앙값

•최빈값

1. 개념소개

= (New – Old) / Old

= 인구 x명당(per)

= Average vs. Median

= 가장빈번히나타난값

Page 6: LLG Data Journalism Module3 Review

•최고값/최저값

•사분위수

•표준편차

1. 개념소개

= 내림차순/오름차순

= 25% / 50% / 75% / 100%

= to find outliers

Page 7: LLG Data Journalism Module3 Review

•상관관계

•회귀분석

1. 개념소개

= 인과관계분석을위한

= A와 B가상관관계에있으면A와 B가인과관계에있다?

Page 8: LLG Data Journalism Module3 Review

2. 분석툴

Page 9: LLG Data Journalism Module3 Review

• 엑셀

2. 분석툴

• 오픈리파인http://openrefine.org/

• R 통계프로그램http://www.r-project.org/

• 하둡

Page 10: LLG Data Journalism Module3 Review

• 엑셀

• Freeze(틀고정)

• Sort & Filter (정렬&필터)

• 계산식• 함수• 피벗테이블

2. 분석툴

Page 11: LLG Data Journalism Module3 Review

• 오픈리파인 (Openrefine)

• 데이터정제툴• Facet 기능

2. 분석툴

Page 12: LLG Data Journalism Module3 Review

• R

• 오픈소스통계패키지• 성능• 그래픽가능• R언어

2. 분석툴

Page 13: LLG Data Journalism Module3 Review

• 하둡

• 오픈소스• 빅데이터처리• 분산시스템

2. 분석툴

Page 14: LLG Data Journalism Module3 Review

3. 데이터분석사례

Page 15: LLG Data Journalism Module3 Review

3. 데이터분석사례

• 비만도

• Freeze / 정렬기능• 최고/최저값• 증감률• 비율활용(per 값)

• 평균, 중앙값• 상관관계

• 월드컵 H조득실점

• 최빈값• 피벗테이블

Page 16: LLG Data Journalism Module3 Review

• Discussion Points (Module 3)

• 주제선정후, 스토리설정이먼저?

데이터분석이먼저?

• 수집한데이터를어떻게분석할지생각해봅시다.

• 데이터분석의깊이는어느정도까지되어야할까요?

(보도수준 / 보고서수준 / 논문수준)

Page 17: LLG Data Journalism Module3 Review

• Discussion Points

• 함형건앵커님주제