4주차 미션!!
1. 기본 미션
p. 279의 확인 문제 5번 풀고 인증하기
2. 선택 미션
Ch.04(04-1)에서 배운 8가지 기술통계량(평균, 중앙값, 최솟값, 최댓값, 분위수, 분산, 표준편차, 최빈값)의 개념을 정리하기
- 평균 (Mean)
- 모든 데이터 값을 더한 후, 데이터의 개수로 나눈 값.
- 모든 값의 합을 데이터의 개수로 나눈 것으로, 데이터의 대표값을 계산하는 데 자주 사용된다.
- 중앙값 (Median)
- 데이터를 크기 순서로 정렬했을 때 가운데에 위치한 값.
- 이상치에 영향을 덜 받고 데이터의 중심 경향성을 파악하는 데 사용된다.
- 최솟값 (Minimum)
- 데이터 중에서 가장 작은 값.
- 최댓값 (Maximum)
- 데이터 중에서 가장 큰 값.
- 분위수 (Quartiles)
- 데이터를 크기 순서로 정렬했을 때, 4등분한 지점에 위치한 값들.
- 주로 중간값(2분위수)과 함께 사용되며, 데이터의 분포를 더 자세히 파악할 수 있다.
- 분산 (Variance)
- 각 데이터가 평균에서 얼마나 떨어져 있는지를 나타내는 측정값.
- 값들의 차이를 제곱하여 평균을 구한 것으로, 분포의 퍼진 정도를 표현한다.
- 표준편차 (Standard Deviation):
- 분산의 양의 제곱근.
- 데이터의 산포 정도를 측정하며, 분산과 함께 사용하여 데이터의 변이를 파악한다.
- 최빈값 (Mode)
- 데이터 중에서 가장 자주 나타나는 값.
- 이산형 데이터의 대표값을 찾을 때 주로 활용되며, 데이터의 특징을 파악하는 데 도움을 준다.
'혼공학습단 > 데이터 분석 with 파이썬' 카테고리의 다른 글
[데이터 분석] 혼공학습단 11기_6주차 (0) | 2024.02.08 |
---|---|
[데이터 분석] 혼공학습단 11기_5주차 (0) | 2024.02.03 |
[데이터 분석] 혼공학습단 11기_3주차 (0) | 2024.01.21 |
[데이터 분석] 혼공학습단 11기_2주차 (0) | 2024.01.10 |
[데이터 분석] 혼공학습단 11기_1주차 (0) | 2024.01.03 |