반응형

1. 영상 획득과 표현

디지털 카메라는 실존하는 피사체를 일정 간격으로 샘플링하고 명암을 일정 간격으로 양자화하는 과정을 통해 영상을 획득한다.
 

- 핀홀 카메라와 디지털 변환

https://en.wikipedia.org/wiki/Pinhole_camera_model

핀홀 카메라 모델의 핵심은 물체에서 반사된 빛은 위의 그림과 같이 작은 구멍을 통해 안으로 들어가 뒷면에 있는 영상 평면(image plane)에 맺힌다. 디지털 카메라의 경우 CCD 센서에 해당한다. 빛이라는 아날로그 신호를 받은 CCD 센서는 디지털 신호로 변환한 영상을 메모리에 저장한다. 디지털 신호로 변환하는 과정에서 샘플링(sampling)과 양자화(quantization)를 수행한다.
샘플링은 2차원 영상 공간을 가로 방향으로 N개 세로 방향으로 M개 구간으로 나눈다. 이 과정을 통해 형성된 한 점을 흔히 픽셀이라고 불리는 화소(pixel)라 하고, M x N을 영상의 해상도라 한다.
그리고 양자화는 화소의 명암을 L개 구간으로 나누는 것이고, 일반적으로 L=256을 사용한다.

https://www.codingninjas.com/studio/library/image-sampling-and-quantization

 

- 영상 좌표계: (y, x)와 (x, y) 표기

디지털 영상의 좌표는 두 가지 측면에서 일반적인 표기와 다르다.
첫째, 원점이 좌측 하단이 아니라 좌측 상단이다. ~ 과거에 사용하던 CRT 화면의 전자총이 왼쪽 위에서 시작해 아래로 진행하는 물리적 특성에서 유래했다.
둘째, (x, y) 대신 (y, x) 표기를 사용한다. ~ 수학의 행렬과 프로그래밍 언어의 배열에서 행의 좌표를 먼저 적고 열의 좌표를 뒤에 적는 관행에서 유래했다.
 

2. 다양한 종류의 영상

물체가 반사한 빛을 측정한 디지털 영상: 명암 영상, 컬러 영상, 컬러 동영상, 다분광/초분광/MR/CT 영상
거리를 측정한 영상: RGB-D 영상, 점 구름 영상
 

3. 컬러 모델

RGB cube & HSV color model

왼쪽은 RGB 컬러 모델이며, 빨강(R), 녹색(G), 파랑(B)의 세 요소를 섞으면 세상의 모든 색을 표현할 수 있다는 것이다. 디지털 영상을 표현할 때는 주로 256단계로 양자화해 한 바이트로 표현한다. 예를 들어 Red는 (255, 0, 0)이다.
오른쪽은 HSV 컬러 모델이며 H는 색상, S는 채도, V는 명암을 표현한다. RGB 모델에서는 빛의 밝기가 R, G, B 3요소에 섞여있기 때문에 빛이 약해지면 R, G, B 값이 모두 작아진다. 이런 성질은 빛의 세기가 서로 다른 배경에 있는 객체를 검출하는 computer vision program을 제작하는 데 방해요인이 될 수 있다. HSV 모델은 색상은 H 요소, 빛의 밝기는 V 요소에 집중되어 있어 빛의 세기와 관계 없이 객체를 검출해야 하는 프로그램을 제작할 때 유리하다.