반응형

빅데이터의 5가지 특성 - 5V

데이터의 양(volume), 데이터의 생성 속도(velocity), 형태의 다양성(variety), 데이터의 정확성(veracity), 데이터의 가치(value)

 

1) 데이터의 양(volume)

빅데이터의 크기(실제 저장되는 물리적 데이터의 양)

→ Phone, Desktop, Sensor 등에 의해 엄청난 양의 데이터가 생성되고 있음(ex: instagram, youtube, tistory, etc.)

 

2) 데이터 생성 속도(velocity)

정보화 사회에 도래함으로써 데이터가 셀 수 없을 정도의 수많은 정보가 현재에도 빠르게 생성되고 있음

→ 데이터 분석에서는 이렇게 실시간으로 빠르게 생성되는 다양한 데이터를 다룰 수 있어야 함

 

3) 형태의 다양성(variety)

실제 데이터의 80% 이상은 구조화할 수 없는 데이터 → 다양한 센서를 통해 수집되는 데이터, 음성, sns 글, 사진, 동영상

 

4) 데이터의 정확성(veracity)

데이터가 얼마나 신뢰성(trustworthy)이 있는지, 데이터의 품질이 좋은지에 관한 것이 정확성을 따지는 지표가 됨

 

5) 데이터의 가치(value)

비즈니스 또는 연구에 유용하게 활용될 만한 가치가 있어야 함