데이터 스토리텔링 본문
데이터 스토리텔링
- 2024. 11. 16. 12:04
1. 데이터 저널리즘
데이터 저널리즘 = 데이터를 이용한 뉴스 스토리텔링
데이터 시대에 거대한 데이터 셋을 선별하고 분석해서
새로운 뉴스 스토리를 만들고
그 영향력을 끌어올리는 것
- wikipedia -
데이터를 이용해서 뉴스를 작성하고
보도의 품질을 높임으로써
뉴스 스토리에 보다 깊은 통찰을 제공하고
관련된 데이터를 돋보이게 전달하는 것
- Antonopoulos and Karyotakis -
데이터 시대의 데이터 저널리즘
"지금까지 볼 수 없었던 이슈를 끄집어내다"
알려지지 않은 스토리를 발굴
새로운 시각을 발견
분석 과정에서 스토리의 완성도 제고
형태와 규모 관계없이 데이터 처리 및 결과 도출
- Henk van Ess -
DataPov = Data Point of View (데이터를 어떤 시각을 가지고 바라볼 것인가)
- 현재 = 데이터 자원을 어떻게 바라봐야 할까?
- 데이터를 다루는 시각
- 분명한 통계적 목표 : 목표로 하는 통계적 결과를 확실히 할 것
- 명확한 예측 : 그 결과가 보여줄 미래를 명확하게 할 것
- 필요 조치 발견 : 데이터 분석 결과로 필요한 조치를 발견할 것
- 데이터의 관점을 명확히 갖지 않으면
데이터 처리 & 스토리가 흔들릴 수 있다. - 데이터 스토리텔링의 시각
- 데이터를 기반으로 어떤 조치를 취할 것인가
- 그 조치는결과를 어떻게 개선할 것인가
- 어떻게 새로운 문제와 기회를 도출할 것인가
Data Explanatory Point (데이터의 분석 결과를 설명할 때 주의해야 할 점은?)
- 설명하는 공간 = Explanatory Space
- 설명하고 싶은 바로 그 대상
- 말하고 싶은 바로 그 스토리 - Data Explanatory Point (목표, 예측, 조치만 집중해야 한다)
- 100개의 조개 가운데 진주를 가진 2개의 조개에 집중
- 모든 조개, 진주를 찾은 노력을 설명하고 싶은 욕심을 피해야 / 관점이 흔들림
Process of Data Journalism
데이터의 가치를 올리는 과정 = find -> clean -> visualize -> smart storytelling
Process of Data Journalism - Find : Data set 얻는 과정
- 공공데이터포털
https://data.go.kr
https://data.gov
https://data.gov.uk - 정보공개청구 : 공공기관에 원하는 정보가 공개되지 않았을 경우
- Web 상의 공개 정보
- Crowd Sourcing = 설문 이벤트 등을 통해 정보 수집
- Data Scraping
import.io
browse.ai
OutWit Hub
Process of Data Journalism - Clean : 시각화를 위해 데이터를 선별하고 변형하는 과정
- OpenRefine
- Data Wrangler
- Google Spread Sheet
- Excel + GPT : 복잡한 자료 속에서도 매우 신속하게 필요한 데이터 추출
Process of Data Journalism - Visualize : 데이터를 시각화하는 과정
분석 결과 패턴을 정적 또는 동적인 비주얼로 그려내는 과정
- Number pull quote (숫자)
- Static Map (지도)
- List and timelines (시계열표, 타임라인)
- Table (표)
- Dynamic Map (동적인 지도)
- Textual analysis (주요 단어를 나타내는 words cloud)
- Infographics (만화, 이미지, 사진 등을 활용)
Process of Data Journalism - Smart Storytelling
7개의 관점 중 필요한 것에만 집중 필요
- 시계열 - Narrate change over time
- 점강 - Start big and drill down
- 점증 - Start small and zoom out
- 특징 대조 - Highlight contrasts
- 교집한 추출 - Explore the intersection
- 요인 분석 - Dissect the factors
- 국외자 설명 - Profile the outliers
인공지능 시대 프로세스의 변화
명령어만 넣으면 바로 스마트 스토리텔링 가능 (중간 단계가 사라짐 : find, clean, visualize 가 사라짐)
목표 등 데이터 관점을 정확히 할 것!
Data visualization by ChatGPT 예제
prompt:
대한민국의 2010년부터 2020년까지 1인당 GDP를 알려주세요. (기존 Find 단계)
정리 결과는 아래와 같은 예시의 표로 정리해 주세요. (기존 clean 단계)
예시 :
Column = 연도 / 1인당 GDP
Row = 2010 / 2011 / 2012 / ...
그 추이를 chart로 그려주세요. (기존 Visualize 단계)
2. 차트 갤러리
차트의 종류 : 흩어져 있는 많은 데이터가 존재하기 때문에 다차원의 차트가 늘어나고 있다
- Excel Sheet
- Google Chart
- Steamlit
- Box plot (전체 데이터를 1/4로 나누어 표기) - 학교 학급의 성적 분포를 한눈에 볼 때 매우 유용
- 한 집단의 속성을 테이터로 분석하기 좋은 Box Plot
- Violin plot
- Heat Map
- Scatter plot
- Joint plot ( violin plot / heat map / scatter plot 혼용)
왜 Data Storytelling을 알아야 할까?
반응형
RECENT COMMENT