Python 데이터 분석 4대 라이브러리 정리

728x90

Python으로 데이터 분석할 때 필수로 쓰는 라이브러리 4가지를 정리한다.

pandas     →  데이터 가공 (엑셀 역할)
numpy      →  수치 계산 (계산기 역할)
matplotlib →  시각화 (그래프 그리기)
seaborn    →  예쁜 시각화 (matplotlib 업그레이드)

설치

python

!pip install pandas==2.2.2
!pip install numpy==2.0.2
!pip install matplotlib
!pip install seaborn

1. pandas - 코드로 하는 엑셀/SQL

데이터를 표(DataFrame) 형태로 다루는 라이브러리. 엑셀을 코드로 조작한다고 생각하면 된다.

주요 기능

데이터 읽기/쓰기 (CSV, Excel, JSON, DB)
필터링, 정렬, 그룹화
결측치 처리, 데이터 정제
통계 계산, 집계
테이블 합치기 (merge, join)

python

import pandas as pd

# CSV 읽기
df = pd.read_csv('data.csv')

# 필터링 (SQL의 WHERE)
df[df['age'] > 30]

# 그룹화 (SQL의 GROUP BY)
df.groupby('region')['sales'].sum()

# 정렬 (SQL의 ORDER BY)
df.sort_values('sales', ascending=False)

2. numpy - 빠른 숫자 계산

배열(array) 연산에 특화된 수학 라이브러리. 반복문 없이 대량 계산이 가능하다.

python

import numpy as np

# 배열 생성
arr = np.array([1, 2, 3, 4, 5])

# 한 번에 계산 (반복문 없이)
arr * 2        # [2, 4, 6, 8, 10]
arr.mean()     # 평균: 3.0
arr.std()      # 표준편차

3. matplotlib - 그래프의 기본

Python 시각화의 기본. 모든 종류의 그래프를 그릴 수 있다.

python

import matplotlib.pyplot as plt

# 바 차트
plt.bar(['서울', '부산', '대구'], [100, 80, 60])
plt.title('지역별 당첨 횟수')
plt.show()

# 선 그래프
plt.plot([1, 2, 3, 4], [10, 20, 25, 30])
plt.show()

4. seaborn - 예쁜 matplotlib

matplotlib 기반인데 더 예쁘고 간편하다. 통계적 시각화에 강점.

보너스: 샘플 데이터 내장 (Oracle의 SCOTT/TIGER 같은 것)

titanic - 타이타닉 생존자 데이터
tips - 레스토랑 팁 데이터
iris - 붓꽃 품종 데이터

python

import seaborn as sns

# 샘플 데이터 로드
tips = sns.load_dataset('tips')

# 예쁜 바 차트
sns.barplot(data=tips, x='day', y='total_bill')

# 히스토그램
sns.histplot(data=tips, x='total_bill')
```

## 라이브러리 관계도
```
numpy (숫자 계산)
   ↓
pandas (데이터 가공) → matplotlib (시각화)
                            ↓
                       seaborn (예쁜 시각화)

정리

라이브러리한 줄 정리비유

pandas	데이터 가공/분석	코드로 쓰는 엑셀
numpy	수치 계산	고속 계산기
matplotlib	기본 시각화	그래프 공장
seaborn	예쁜 시각화	matplotlib + 화장

728x90

'Tech Notes' 카테고리의 다른 글

uv: Python 개발자라면 지금 바로 설치해야 할 차세대 패키지 매니저 (0)	2026.01.12
Next.js 긴급 보안 취약점 CVE-2025-66478 정리 (0)	2026.01.12
NestJS + gRPC 엔터프라이즈 아키텍처 (0)	2025.12.23
2025 AI 코딩 도구 총정리 (0)	2025.12.17
Python OnPromise Structure 비교 Electron + Python vs PyWebView + PyInstaller (0)	2025.12.08

Miracle's Dev Log

Python 데이터 분석 4대 라이브러리 정리

설치

1. pandas - 코드로 하는 엑셀/SQL

2. numpy - 빠른 숫자 계산

3. matplotlib - 그래프의 기본

4. seaborn - 예쁜 matplotlib

정리

'Tech Notes' 카테고리의 다른 글

티스토리툴바

Python 데이터 분석 4대 라이브러리 정리

설치

1. pandas - 코드로 하는 엑셀/SQL

2. numpy - 빠른 숫자 계산

3. matplotlib - 그래프의 기본

4. seaborn - 예쁜 matplotlib

정리

'Tech Notes' 카테고리의 다른 글

관련글

티스토리툴바