📍 머신 러닝을 위한 파이썬 라이브러리(Python library)
안녕하세요!
오늘은 머신 러닝을 위해 꼭 설치해야 하는 파이썬 라이브러리에 대해 소개해 드리려고 해요. 머신 러닝을 위한 라이브러리는 다양하지만 데이터 분석을 위한 필수 라이브러리 등이고, 딥 러닝은 제외했습니다!
설치를 위해서 python 터미널 내부에서 사용하시고 pip 버전이 최신이어야 다운이 가능하니 참고해 주세요.
아래에 있는 코드를 그대로 적어서 다운로드하시면 바로 사용이 가능합니다.
📌 Numpy
Numpy는 파이썬의 수학 및 과학 계산에 쓰이는 핵심 라이브러리 중 하나에요. 다차원 배열과 행렬을 다루는데 사용되고 데이터 처리를 위한 기본적인 기능을 제공해 줘요. 또 머신 러닝뿐만 아니라 데이터 분석, 신호 처리, 영상 처리 등 다양한 과학적 분야에서도 사용이 됩니다. 그리고 pandas와 matplotlib과 함께 많이 사용하는 함수입니다!
pip install numpy
🎈 Numpy 사용 예시
import numpy as np
matrix = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
# 전치 행렬
transposed_matrix = matrix.T
# 배열 모양 변경
reshaped_array = matrix.reshape((1, 9))
print(reshaped_array)
📌 Pandas
Pandas는 데이터 조작과 분석을 위한 파이썬 라이브러리로, 표 형태의 데이터를 다루기 위해 사용합니다. Pandas는 데이터 프레임(DataFrame)과 시리즈(Series)라는 두 가지 주요 데이터 구조가 있는데, 데이터 처리, 정제, 분석, 시각화 작업에 매우 유용합니다. 데이터 과학 및 데이터 분석 분야에서 Numpy와 같이 사용하며 데이터 전처리 과정에서 꼭 필요한 도구 중 하나입니다.
pip install pandas
🎈 Pandas 사용 예시
import pandas as pd
data = {'이름': ['Alice', 'Bob', 'Charlie'],
'나이': [25, 30, 35]}
df = pd.DataFrame(data)
# 열 선택
ages = df['나이']
# 행 선택
row = df.loc[1] # 인덱스 1인 행 선택
print(row)
📌 Matplotlib
Matplotlib은 파이썬에서 수집한 데이터를 시각화 및 그래프 작성을 위한 라이브러리로, 2D 또는 3D 그래프를 생성하기 위해 사용합니다. 영상 처리에서 이미지의 색상 RGB 그래프를 보여주는 등 다양한 그래프를 만들기 위해 사용하는 함수입니다.
pip install matplotlib
📌 Seaborn
Seaborn도 파이썬의 데이터 시각화 라이브러리로 Matplotlib에 기반하면서 기능을 보완하고 확장한 도구입니다. Seaborn의 수준 높은 그래프로 머신 러닝의 모델 매개 변수를 제거해 주거나 데이터의 시각화를 쉽게 수행할 수 있도록 도와줍니다. 데이터의 패턴, 관계, 분포 등을 시각화하여 내재된 정보를 빠르게 발견하고 인사이트를 얻을 수 있습니다.
pip install seaborn
📌 Scikit-Learn
Scikit-Learn은 sklearn이라고도 불리는데 파이썬의 머신 러닝 라이브러리입니다. 기계 학습 모델을 구축, 훈련 및 평가하기 위한 도구를 제공하고 개발 및 연구 목적으로 머신 러닝 모델을 개발하는 데이터 과학자, 엔지니어 및 연구원들이 사용하는 라이브러리입니다. 이 라이브러리는 Scikit-Learn이라고 부르지만 코드를 작성할 때는 sklearn로 불러와서 혼동이 올 수 있으니 참고해 주세요!
pip install sklearn
자 여기까지 머신 러닝에 필요한 함수들에 대해 소개해 드렸어요!
저도 현재 공부 중인데 다양한 함수들을 사용하면서 데이터를 조작하고 정제하는 과정이 정말 신기하고 재미있었어요. 그럼 다음에도 유익한 정보를 가지고 오겠습니다!