데이터 스토리텔링 본문

데이터 스토리텔링

 

1. 데이터 저널리즘

데이터 저널리즘 = 데이터를 이용한 뉴스 스토리텔링

 

데이터 시대에 거대한 데이터 셋을 선별하고 분석해서
새로운 뉴스 스토리를 만들고
그 영향력을 끌어올리는 것
- wikipedia -

 

데이터를 이용해서 뉴스를 작성하고
보도의 품질을 높임으로써
뉴스 스토리에 보다 깊은 통찰을 제공하고
관련된 데이터를 돋보이게 전달하는 것
- Antonopoulos and Karyotakis -

 

데이터 시대의 데이터 저널리즘

"지금까지 볼 수 없었던 이슈를 끄집어내다"
알려지지 않은 스토리를 발굴
새로운 시각을 발견
분석 과정에서 스토리의 완성도 제고
형태와 규모 관계없이 데이터 처리 및 결과 도출
- Henk van Ess -

 

DataPov = Data Point of View (데이터를 어떤 시각을 가지고 바라볼 것인가)

  • 현재 = 데이터 자원을 어떻게 바라봐야 할까?
  • 데이터를 다루는 시각
    - 분명한 통계적 목표 : 목표로 하는 통계적 결과를 확실히 할 것
    - 명확한 예측 : 그 결과가 보여줄 미래를 명확하게 할 것
    - 필요 조치 발견 : 데이터 분석 결과로 필요한 조치를 발견할 것

Data Point of View : 데이터를 다루는 시각

  • 데이터의 관점을 명확히 갖지 않으면
    데이터 처리 & 스토리가 흔들릴 수 있다.
  • 데이터 스토리텔링의 시각
    - 데이터를 기반으로 어떤 조치를 취할 것인가
    - 그 조치는결과를 어떻게 개선할 것인가
    - 어떻게 새로운 문제와 기회를 도출할 것인가

Data Point of View : 데이터 스토리텔링의 시각

 

Data Explanatory Point (데이터의 분석 결과를 설명할 때 주의해야 할 점은?)

  • 설명하는 공간 = Explanatory Space
    - 설명하고 싶은 바로 그 대상
    - 말하고 싶은 바로 그 스토리
  • Data Explanatory Point (목표, 예측, 조치만 집중해야 한다)
    - 100개의 조개 가운데 진주를 가진 2개의 조개에 집중
    - 모든 조개, 진주를 찾은 노력을 설명하고 싶은 욕심을 피해야 / 관점이 흔들림

 

Process of Data Journalism

데이터의 가치를 올리는 과정 = find -> clean -> visualize -> smart storytelling

Process of Data Journalism - rising value to public

 

Process of Data Journalism - Find : Data set 얻는 과정

  1. 공공데이터포털
    https://data.go.kr
    https://data.gov
    https://data.gov.uk
  2. 정보공개청구 : 공공기관에 원하는 정보가 공개되지 않았을 경우
  3. Web 상의 공개 정보
  4. Crowd Sourcing = 설문 이벤트 등을 통해 정보 수집
  5. Data Scraping
    import.io
    browse.ai
    OutWit Hub

 

Process of Data Journalism - Clean : 시각화를 위해 데이터를 선별하고 변형하는 과정

  • OpenRefine
  • Data Wrangler
  • Google Spread Sheet
  • Excel + GPT : 복잡한 자료 속에서도 매우 신속하게 필요한 데이터 추출

 

Process of Data Journalism - Visualize : 데이터를 시각화하는 과정

분석 결과 패턴을 정적 또는 동적인 비주얼로 그려내는 과정
  • Number pull quote (숫자)
  • Static Map (지도)
  • List and timelines (시계열표, 타임라인)
  • Table (표)
  • Dynamic Map (동적인 지도)
  • Textual analysis (주요 단어를 나타내는 words cloud)
  • Infographics (만화, 이미지, 사진 등을 활용)

 

Process of Data Journalism -  Smart Storytelling

7개의 관점 중 필요한 것에만 집중 필요
  • 시계열 - Narrate change over time
  • 점강 - Start big and drill down
  • 점증 - Start small and zoom out
  • 특징 대조 - Highlight contrasts
  • 교집한 추출 - Explore the intersection
  • 요인 분석 - Dissect the factors
  • 국외자 설명 - Profile the outliers

 

인공지능 시대 프로세스의 변화

명령어만 넣으면 바로 스마트 스토리텔링 가능 (중간 단계가 사라짐 : find, clean, visualize 가 사라짐)
목표 등 데이터 관점을 정확히 할 것!

Data visualization by ChatGPT - Prompt to response

Data visualization by ChatGPT 예제
prompt:
대한민국의 2010년부터 2020년까지 1인당 GDP를 알려주세요. (기존 Find 단계)

정리 결과는 아래와 같은 예시의 표로 정리해 주세요. (기존 clean 단계)

예시 :
Column = 연도 / 1인당 GDP
Row = 2010 / 2011 / 2012 / ...

그 추이를 chart로 그려주세요. (기존 Visualize 단계)

 

 

2. 차트 갤러리

차트의 종류 : 흩어져 있는 많은 데이터가 존재하기 때문에 다차원의 차트가 늘어나고 있다

  • Excel Sheet
  • Google Chart
  • Steamlit
  • Box plot (전체 데이터를 1/4로 나누어 표기) - 학교 학급의 성적 분포를 한눈에 볼 때 매우 유용
    - 한 집단의 속성을 테이터로 분석하기 좋은 Box Plot

Box plot

  • Violin plot
  • Heat Map
  • Scatter plot
  • Joint plot ( violin plot / heat map / scatter plot 혼용)

 

왜 Data Storytelling을 알아야 할까?

정보 피라미드 = knowledge 가 스토리텔링 단계

 

데이터 피라미드 = trend가 스토리텔링 단계

 

 

반응형

공부는 끝이 없다/미디어혁신과 뉴스 스토리텔링 Related Articles

MORE