혼공학습단/데이터 분석 with 파이썬

혼공학습단/데이터 분석 with 파이썬

[데이터 분석] 혼공학습단 11기_6주차

6주차 미션!! 1. 기본 미션 p. 344의 손코딩(맷플롯립의 컬러맵으로 산점도 그리기)을 코랩에서 그래프 출력하고 화면 캡처하기 2. 선택 미션 p. 356 ~ 359의 스택 영역 그래프를 그리는 과정을 정리하기 데이터 전처리 pivot_table() 메서드를 사용하여 각 '발행년도' 열의 값을 열로 바꾸기 이를 통해 얻은 2차원 배열은 행이 각 '출판사'에 해당하고 열은 '발행년도'로 구성 데이터 구성 '발행년도' 열을 리스트 형태로 바꾸기 이를 통해 얻은 리스트는 y축에 넣을 데이터로 사용 스택 영역 그래프 그리기 stackplot() 메서드를 사용하여 스택 영역 그래프 그리기 첫 번째 매개변수에 x축의 값인 '발행년도'를, 두 번째 매개변수에는 y축 값을 2차원 배열로 전달

혼공학습단/데이터 분석 with 파이썬

[데이터 분석] 혼공학습단 11기_5주차

5주차 미션!! 1. 기본 미션 p. 314의 손코딩(맷플롯립에서 bar()함수로 막대 그래프 그리기)을 코랩에서 그래프 출력하고 화면 캡처하기 코드 import gdown gdown.download('https://bit.ly/3pK7iuu', 'ns_book7.csv', quiet=False) import pandas as pd ns_book7 = pd.read_csv('ns_book7.csv', low_memory=False) import numpy as np def kdc_1st_char(no): if no is np.nan: return '-1' else: return no[0] count_by_subject = ns_book7['주제분류번호'].apply(kdc_1st_char).value_c..

혼공학습단/데이터 분석 with 파이썬

[데이터 분석] 혼공학습단 11기_4주차

4주차 미션!! 1. 기본 미션 p. 279의 확인 문제 5번 풀고 인증하기 2. 선택 미션 Ch.04(04-1)에서 배운 8가지 기술통계량(평균, 중앙값, 최솟값, 최댓값, 분위수, 분산, 표준편차, 최빈값)의 개념을 정리하기 평균 (Mean) 모든 데이터 값을 더한 후, 데이터의 개수로 나눈 값. 모든 값의 합을 데이터의 개수로 나눈 것으로, 데이터의 대표값을 계산하는 데 자주 사용된다. 중앙값 (Median) 데이터를 크기 순서로 정렬했을 때 가운데에 위치한 값. 이상치에 영향을 덜 받고 데이터의 중심 경향성을 파악하는 데 사용된다. 최솟값 (Minimum) 데이터 중에서 가장 작은 값. 최댓값 (Maximum) 데이터 중에서 가장 큰 값. 분위수 (Quartiles) 데이터를 크기 순서로 정렬했을..

혼공학습단/데이터 분석 with 파이썬

[데이터 분석] 혼공학습단 11기_3주차

3주차 미션!! 1. 기본 미션 p. 182의 확인 문제 2번 풀고 인증하기 2. 선택 미션 p. 219의 확인 문제 5번 풀고 인증하기 3. 필기 https://github.com/mic050r/DataAnalysis_for_studying_alone/blob/main/3%EC%B0%A8%EC%8B%9C/%EB%A7%88%EB%AC%B4%EB%A6%AC%EC%A0%95%EB%A6%AC.md

혼공학습단/데이터 분석 with 파이썬

[데이터 분석] 혼공학습단 11기_2주차

2주차 미션!! 1. 기본 미션 p. 150의 확인 문제 1번 풀고 인증하기 2. 선택 미션 p. 137 ~ 138 손코딩 실습으로 원하는 도서의 페이지 수를 추출하고 화면 캡처하기 코드 import requests from bs4 import BeautifulSoup def get_page_cnt(isbn): # Yes24 도서 검색 페이지 URL url = 'http://www.yes24.com/Product/Search?domain=BOOK&query={}' # URL에 ISBN을 넣어 HTML 가져오기 r = requests.get(url.format(isbn)) soup = BeautifulSoup(r.text, 'html.parser') # HTML 파싱 # 검색 결과에서 해당 도서를 선택 p..

혼공학습단/데이터 분석 with 파이썬

[데이터 분석] 혼공학습단 11기_1주차

1주차 미션!! 1. 기본 미션 p. 81의 확인 문제 4번 풀고 인증하기 2. 선택 미션 p. 71 ~ 73 남산 도서관 데이터를 코랩에서 데이터프레임으로 출력하고 화면 캡처하기 코드 from google.colab import drive drive.mount('/content/drive') import pandas as pd df = pd.read_csv('서울특별시교육청남산도서관 장서 대출목록 (2023년 11월).csv', encoding='EUC-KR', low_memory=False) df.head() 결과 3. 실습 및 필기 3-1. 실습 DataAnalysis_for_studying_alone/Chapter01 at main · mic050r/DataAnalysis_for_studying_..

혼공학습단/데이터 분석 with 파이썬

[데이터 분석] Chapter 01

데이터 분석이란? 데이터 분석에 대해 자세히 궁금하신 분은 아래의 글을 참고해주세요! 데이터 분석과 데이터 과학, 데이터 마이닝과 머신러닝 데이터 분석과 데이터 과학이 가장 크게 다른 점은 두 분야가 만들어 내는 ‘결과물’입니다. 데이터 분석은 올바른 의사 결정을 돕기 위한 통찰을 제공하는 데 초점을 맞추고, 데이터 과학은 hongong.hanbit.co.kr 이 도서가 얼마나 인기가 많을까요? #공개데이터 세트 #CSV #판다스 #데이터 프레임 1. 도서관 데이터 준비 가장 인기가 많은 도서를 찾기 위해 도서관 정보나루 홈페이지에서 서울특별시교육청남산도서관 장서 대출목록 (2023년 11월).csv를 다운 받아주도록 하겠습니다. csv 파일? CSV 파일은 콤마(,)로 구분된 텍스트입니다. → 한 줄이..

노 코딩 노 라이프
'혼공학습단/데이터 분석 with 파이썬' 카테고리의 글 목록