본문으로 건너뛰기

데이터 시각화에 관해

· 약 3분
jun

데이터 시각화란?

어떻게 쓰이나 !

  • 혹시 DDD라고 아시나요?
    • Data Driven Decision의 약어로 ‘데이터 기반 의사결정’을 뜻합니다.
  • 기업에서 새로운 기능을 기획하거나, 사업을 추진할때 데이터는 필수적인 요소인데요 !
    • 정량적인 데이터를 기반으로 최대한 객관적인 판단을 위해 위 작업이 필요합니다.
    • 고객에게 A가 필요할까? B가 필요할까? 와 같은 고민은 데이터를 기반으로 의사결정에 도움이 될 수 있어요!

어떻게 구성되나요?

  • 데이터에는 매우 다양한 종류와 유형이 있어요
    • 매출&계약 데이터 (Salesforce, Google Sheets 등)
    • 플랫폼 데이터 (Google Anlytics, GCP, DB 등)
    • 정성적 데이터 (notion, monday, Jira 등)
  • 기업의 모든 내용은 데이터로 측정되는게 중요해요!

어떻게 만드나요!

  1. 데이터 수집
    1. 데이터가 쌓이고 있지 않다면 데이터를 축적하는 작업부터 필요해요.
      1. 데이터는 어디서부터 오지?
      2. 어떤 방식으로 쌓아야할까?
      3. 지속가능한 데이터 수집은 뭘까?
  2. 데이터 정제 / 가공
    1. 데이터의 종류가 다양한 만큼 데이터는 통일된 형태로 존재하지 않아요.
      1. 데이터를 모두 raw data 형태로 변환합니다. (필수적인 작업은 아니에요!) 다만 시각화하고자 하는 데이터의 종류가 엄청 다양할때는 통일된 형태 (raw)형식으로 수집합니다. Raw Data 형식이란: 엑셀이 적합한 예시가 될 수 있겠네요! 행과 열로 구분된 데이터입니다.
  3. 데이터 기준점 설정 (reference point)
    1. 데이터의 종류가 모두 달라도 같은 기업내에 있는 데이터라면 분명 연관되어 있는 부분이 있어요!
      Ex) 매출데이터 ↔ 플랫폼 데이터: 고객사의 계약 내용과 고객사의 플랫폼 내용이 ‘고객사’라는 기준점을 가지고 데이터가 구성될 수 있어요!
  4. 데이터 시각화
    1. 시각화에는 다양한 툴들이 사용됩니다. Powerpoint나 Google Sheet가 될수도 있고, 보다 복합적이고 고도화된 시각화가 필요하다면 Google Looker Studio, Microsoft Power BI 등이 사용될 수 있어요!
  5. 데이터 예측
    1. 보통 ML (머신러닝) 모델을 구축합니다. 그동안의 데이터를 기반으로 앞으로의 데이터를 예측하는 선형 회귀 모델을 만들고는 해요! 이 부분은 다음 포스트때 자세히 작성해보겠습니다!