AI & BigData
[Data Analysis] 판다스 - 시리즈, 데이터프레임
PSLeon
2023. 5. 3. 10:02
반응형
판다스(Pandas)
판다스
판다스는 파이썬의 오픈소스 라이브러리 중 하나로, 데이터를 수집하고 정리하는 데 최적화된 도구
판다스는 시리즈(Series)와 데이터프레임(DataFrame)이라는 구조화된 데이터 형식을 제공
파이썬에서 임포트 하는법
import pandas as pd
판다스의 시리즈(Series)와 데이터프레임(DataFrame)
시리즈(Series): 데이터가 순차적으로 나열된 1차원 배열
데이터프레임(DataFrame:df): 행과 열로 만들어지는 2차원 배열 구조
시리즈
시리즈는 인덱스(index)는 데이터 값(value)와 1:1 대응됨 '{index:value}' ↔ '{key:value}'
이런 관점에서 볼 때, 파이썬의 딕셔너리(dictionary)와 비슷한 구조를 가짐
시리즈 만들기
pandas.Series(딕셔너리)
인덱스 구조
인덱스(index)는 자기와 짝을 이루는 데이터 값의 순서와 주소를 저장함 → 이를 잘 활용하면 데이터 값의 탐색, 정렬, 선택, 결합 등 데이터 조작을 쉽게 할 수 있음
시리즈 클래스의 index 속성을 이용하면 인덱스 배열을 따로 선택할 수 있음
시리즈 클래스의 values 속성을 이용하면 데이터 값 배열만을 따로 선택할 수 있음
- 추가 작성 예정