본문 바로가기
혼공학습단/데이터 분석 with 파이썬

[데이터 분석] 혼공학습단 11기_4주차

by 노 코딩 노 라이프 2024. 1. 27.

4주차 미션!!


1. 기본 미션

p. 279의 확인 문제 5번 풀고 인증하기


2. 선택 미션

Ch.04(04-1)에서 배운 8가지 기술통계량(평균, 중앙값, 최솟값, 최댓값, 분위수, 분산, 표준편차, 최빈값)의 개념을 정리하기
  1. 평균 (Mean)
    • 모든 데이터 값을 더한 후, 데이터의 개수로 나눈 값.
    • 모든 값의 합을 데이터의 개수로 나눈 것으로, 데이터의 대표값을 계산하는 데 자주 사용된다.
  2. 중앙값 (Median)
    • 데이터를 크기 순서로 정렬했을 때 가운데에 위치한 값.
    • 이상치에 영향을 덜 받고 데이터의 중심 경향성을 파악하는 데 사용된다.
  3. 최솟값 (Minimum)
    • 데이터 중에서 가장 작은 값.
  4. 최댓값 (Maximum)
    • 데이터 중에서 가장 큰 값.
  5. 분위수 (Quartiles)
    • 데이터를 크기 순서로 정렬했을 때, 4등분한 지점에 위치한 값들.
    • 주로 중간값(2분위수)과 함께 사용되며, 데이터의 분포를 더 자세히 파악할 수 있다.
  6. 분산 (Variance)
    • 각 데이터가 평균에서 얼마나 떨어져 있는지를 나타내는 측정값.
    • 값들의 차이를 제곱하여 평균을 구한 것으로, 분포의 퍼진 정도를 표현한다.
  7. 표준편차 (Standard Deviation):
    • 분산의 양의 제곱근.
    • 데이터의 산포 정도를 측정하며, 분산과 함께 사용하여 데이터의 변이를 파악한다.
  8. 최빈값 (Mode)
    • 데이터 중에서 가장 자주 나타나는 값.
    • 이산형 데이터의 대표값을 찾을 때 주로 활용되며, 데이터의 특징을 파악하는 데 도움을 준다.