Skip to content
Python을 사용한 경제학자를 위한 데이터 분석 및 시각화

Python을 사용한 경제학자를 위한 데이터 분석 및 시각화

이 글은 Data Carpentry의 의도와 유사하게 어떻게 데이터 분석을 수행하고 Python에서 시각화를 생성하는 기본 개념, 기술 및 도구를 제공하여 경제학자들이 데이터를 능숙하게 다루는 것을 목표로 합니다. Python은 그 간결성, 다재다능성 및 데이터 분석 라이브러리의 풍부한 생태계로 인해 선택된 언어입니다.

이 가이드는 Python을 사용하여 경제 데이터를 탐색하려는 사람들을 대상으로 설계되었으며, 미리 프로그래밍 경험이 없어도 됩니다. 우리의 여정은 Python 구문에 대한 기본 사항에서 시작하여 데이터 가져 오기, 데이터 프레임 조작으로 이동하며 마지막으로 데이터 시각화에 대해 깊게 파고들 것입니다. 이 포괄적인 가이드에서는 Python에서 데이터베이스와 직접 작업하는 방법에 대해서도 다룰 것입니다.

📚

시작하기 전에

Python과 Jupyter 노트북

Python과 Jupyter Notebook은 우리의 여정에서 필수적인 두 가지 도구입니다:

  • Python은 강력한 범용 프로그래밍 언어로, 데이터 분석 및 시각화로 유명합니다.
  • Jupyter Notebook은 라이브 코드, 수식, 시각화 및 설명 문자를 포함하는 문서를 만들고 공유할 수있는 오픈 소스 웹 애플리케이션입니다.

Python과 Jupyter Notebook 설치

Anaconda Distribution을 사용하여 Python과 Jupyter를 설치하는 것이 좋습니다. Anaconda Distribution에는 Python, Jupyter Notebook 및 과학 계산 및 데이터 과학에 일반적으로 사용되는 기타 패키지가 포함되어 있습니다.

설치 지침은 다음과 같습니다.

Windows 및 MacOS
  1. 공식 사이트 (opens in a new tab)에서 Anaconda를 다운로드합니다.
  2. 설치 파일을 실행하고 설치 지침을 따릅니다.
Linux
  1. 터미널을 열고 다음을 입력합니다.
cd /tmp
curl -O https://repo.anaconda.com/archive/Anaconda3-2021.05-Linux-x86_64.sh
bash Anaconda3-2021.05-Linux-x86_64.sh
  1. 설치 화면에 따라 프롬프트를 따릅니다.
설치 확인

새로운 Jupyter 노트북을 열어 오류없이 작동되도록 확인합니다.

jupyter notebook

필요한 파이썬 패키지

이 가이드에서는 Pandas, Matplotlib 및 Seaborn을 포함하여 여러 파이썬 패키지를 사용합니다.

이러한 패키지를 설치하려면 Jupyter 노트북을 열고 다음을 입력하십시오.

!pip install pandas matplotlib seaborn

설치 후에는 패키지를 가져올 수 있습니다.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

파이썬에서 데이터 가져오기

Pandas 라이브러리를 사용하여 Python은 CSV 파일을 포함한 여러 데이터 형식을 가져올 수 있습니다. CSV 파일을 가져오겠습니다.

df = pd.read_csv('data.csv')

파이썬에서 데이터 프레임 조작하기

데이터 프레임은 레이블이 지정된 2차원 데이터 구조입니다. 이는 데이터 분석에서 기본적인 테이블입니다.

열 추가 및 제거

# 새 열 추가
df['new_column'] = new_data
 
# 열 제거
df = df.drop('column_to_drop', axis=1)

요약 통계 계산

Pandas는 기술 통계를 생성하는 describe() 함수를 제공합니다.

df.describe()

파이썬에서 그래프 작성하기

파이썬은 Matplotlib 및 Seaborn을 비롯한 여러 라이브러리를 제공하여 데이터 시각화를 지원합니다. 간단한 라인 플롯 예제를 살펴보겠습니다.

plt.plot(df['column_name'])
plt.show()

파이썬에서 데이터베이스 작업하기

파이썬은 데이터베이스와 직접 상호작용할 수 있다. 파이썬의 sqlite3 모듈은 SQLite 데이터베이스에 대한 인터페이스를 제공한다:


python
import sqlite3
connection = sqlite3.connect('database.db')

연결을 설정한 후 SQL 쿼리를 실행할 수 있다:

df = pd.read_sql_query("SELECT * from TABLE_NAME", connection)

결론

이번 경제학자를 위한 파이썬 소개로 데이터를 가져오고 조작하며 분석하고 시각화하는 기초를 마련하였다. 연습을 통해, 파이썬은 경제 연구와 분석에서 필수적인 도구가 될 것이다. 코딩 즐거운 하루 되세요!

📚