안녕하세요! 김코딩입니다.
파이썬 데이터 분석은 데이터를 수집하고, 정리하고, 분석해서 유용한 정보를 얻는 과정입니다. 예를 들어, 매장 판매 데이터를 분석해 어떤 상품이 가장 잘 팔리는지 확인할 수 있죠.
파이썬은 데이터 분석에 강력한 도구입니다. 엑셀보다 더 많은 데이터를 빠르게 처리할 수 있고, 그래프를 활용해 결과를 시각적으로 표현할 수도 있습니다.
오늘은 파이썬 데이터 분석의 첫걸음으로 pandas와 numpy를 소개하고, 간단한 판매 데이터를 분석한 후 matplotlib을 이용해 시각화까지 해보겠습니다.
2. pandas와 numpy 소개
파이썬 데이터 분석을 시작하려면 두 가지 필수 라이브러리를 알아야 합니다: pandas와 numpy입니다.
pandas: 데이터프레임으로 쉽게 분석
pandas는 데이터를 테이블 형태(엑셀 스프레드시트처럼)로 다룰 수 있는 라이브러리입니다. 이를 활용하면 데이터를 더욱 효율적으로 정리하고 분석할 수 있습니다.
설치 명령어:
pip install pandas
numpy: 빠른 수치 계산
numpy는 숫자 데이터를 빠르게 계산하는 데 유용한 라이브러리입니다. 평균이나 합계를 구할 때 매우 편리합니다.
설치 명령어:
pip install numpy
이 두 라이브러리는 파이썬 데이터 분석의 기본 도구이므로, 설치 후 바로 실습해보겠습니다.
3. 데이터프레임을 활용한 데이터 분석
pandas를 이용해 간단한 판매 데이터를 분석해보겠습니다. 예제 데이터로 과일 가게의 판매 정보를 정리한 뒤, 어떤 과일이 가장 많이 팔렸는지 알아볼까요?
import pandas as pd
data = {
"과일": ["사과", "바나나", "오렌지"],
"판매량": [50, 30, 20],
"가격": [1000, 500, 800]
}
df = pd.DataFrame(data)
print(df)
출력 결과:
과일 판매량 가격
0 사과 50 1000
1 바나나 30 500
2 오렌지 20 800

이제 데이터를 분석해볼까요?
판매량 합계와 평균 구하기
total_sales = df["판매량"].sum()
average_price = df["가격"].mean()
print(f"총 판매량: {total_sales}, 평균 가격: {average_price}원")
출력 결과:
총 판매량: 100, 평균 가격: 766.67원
가장 많이 팔린 과일 찾기
top_fruit = df.loc[df["판매량"].idxmax(), "과일"]
print(f"가장 많이 팔린 과일: {top_fruit}")
출력 결과:
가장 많이 팔린 과일: 사과
4. 데이터 시각화: matplotlib으로 그래프 그리기
matplotlib을 사용하면 데이터를 더 직관적으로 이해할 수 있습니다. 이번에는 판매량을 막대그래프로 표현해보겠습니다.
설치 명령어:
pip install matplotlib
import matplotlib.pyplot as plt
import pandas as pd
# 샘플 데이터 생성
data = {
"과일": ["사과", "바나나", "오렌지", "포도"],
"판매량": [150, 200, 120, 180]
}
df = pd.DataFrame(data)
plt.bar(df["과일"], df["판매량"], color="skyblue")
plt.title("과일 판매량")
plt.xlabel("과일")
plt.ylabel("판매량")
plt.show()

(위 코드를 실행하면 과일별 판매량을 나타내는 막대그래프가 표시됩니다.)
5. 파이썬 데이터 분석의 실용성과 팁
파이썬 데이터 분석을 배우면 실생활에서도 유용한 프로젝트를 만들 수 있습니다. 예를 들어:
- 가게 매출 데이터를 분석해 인기 상품을 파악
- 개인 가계부 정리 및 지출 패턴 분석
- 운동 기록 데이터 분석하여 효과적인 운동 계획 세우기
데이터 분석 팁
작은 데이터부터 시작: 처음에는 간단한 데이터셋으로 연습하세요. 에러 분석: 데이터 형식 오류나 누락된 값이 있을 수 있으니, 에러 메시지를 꼼꼼히 확인하세요. 시각화 활용: 그래프를 그리면 데이터를 더 쉽게 이해할 수 있습니다.
추천 리소스
6. 파이썬 데이터 분석 배우는 이유와 다음 단계
파이썬 데이터 분석을 배우면 데이터를 기반으로 의사 결정을 내릴 수 있습니다. 예를 들어:
- 회사의 매출 데이터를 분석하여 마케팅 전략 수립
- 개인 프로젝트로 건강 데이터 분석 및 시각화
다음 단계로는 데이터 정제(cleaning) 및 머신러닝 기초를 배워보세요!
7. 마무리 및 다음 글 예고
오늘은 파이썬 데이터 분석의 기초를 배웠습니다. pandas와 numpy로 데이터를 다루고 matplotlib으로 데이터를 시각화하는 방법을 익혔습니다.
다음 글에서는 GUI 프로그램을 활용한 데이터 분석을 배워보겠습니다! 더 궁금한 점이 있다면 댓글로 남겨주세요. 함께 파이썬 중급 여정을 이어가요!
[…] 위한 파이썬 활용 시리즈의 세 번째 시간에 오셨군요! 지난 글에서는 파이썬 데이터 분석에 대해 배우면서 pandas와 matplotlib을 활용해 데이터를 다뤄봤어요. 오늘은 […]