반응형

판다스(Pandas)

판다스

판다스는 파이썬의 오픈소스 라이브러리 중 하나로, 데이터를 수집하고 정리하는 데 최적화된 도구

판다스는 시리즈(Series)와 데이터프레임(DataFrame)이라는 구조화된 데이터 형식을 제공

 

파이썬에서 임포트 하는법

import pandas as pd

판다스의 시리즈(Series)와 데이터프레임(DataFrame)

https://qiita.com/alokrawat050/items/f807d193d1e677f6916f

시리즈(Series): 데이터가 순차적으로 나열된 1차원 배열

데이터프레임(DataFrame:df): 행과 열로 만들어지는 2차원 배열 구조

 

시리즈

시리즈는 인덱스(index)는 데이터 값(value)와 1:1 대응됨 '{index:value}' ↔ '{key:value}'

이런 관점에서 볼 때, 파이썬의 딕셔너리(dictionary)와 비슷한 구조를 가짐

 

시리즈 만들기

pandas.Series(딕셔너리)

인덱스 구조

인덱스(index)는 자기와 짝을 이루는 데이터 값의 순서와 주소를 저장함 → 이를 잘 활용하면 데이터 값의 탐색, 정렬, 선택, 결합 등 데이터 조작을 쉽게 할 수 있음

시리즈 클래스의 index 속성을 이용하면 인덱스 배열을 따로 선택할 수 있음

시리즈 클래스의 values 속성을 이용하면 데이터 값 배열만을 따로 선택할 수 있음

 

- 추가 작성 예정