반응형

오늘은 최근 화두가 되고 있는 딥페이크 범죄에 대해 컴퓨터 비전을 전공하는 석사생의 관점에서 이를 예방할 수 있는지에 대해 간단히 포스팅 하고자 한다.

먼저, 최근 뉴스에 많이 언급되는 딥페이크 범죄에 사용되는 방법은 크게 Face Swap과 Undress와 같이 두 개로 나눌 수 있다. 먼저,  Face Swap은 어떤 원본 사진이 있을 때 해당하는 사진의 얼굴을 특정인으로 변경하는 방법이다. 다음으로 Undress는 특정인의 전신 사진을 올리면 옷을 벗겨 나체처럼 보이게 하는 등 여러 방법이 있다.

이는 GAN(Generative Adversarial Network)이라는 생성형 적대적 신경망 혹은 Diffusion(확산) 모델을 통해 주로 이미지를 만들어 낸다. 이는 쉽게 말하자면, ChatGPT가 기존에 학습한 여러 문장, 단어 등을 통해 새로운 글을 창조해내는 것처럼 기존에 학습한 여러 이미지 데이터들을 통해 새로운 이미지를 주어진 명령에 맞게 이미지를 생성하는 인공지능 모델을 뜻한다.

요즘 난리가 난 텔레그램 상에서의 딥페이크 범죄를 알아보자.
텔레그램은 익명성과 프라이버시를 가장 중요하게 여기며 제작된 채팅 어플리케이션이다. 흔히, 수사기관에서 범죄에 연루된 정보를 기업에 공조 요청을 하면 대부분은 협조하지만 텔레그램은 수사기관에 정보를 일체 제공하지 않는다. 따라서 텔레그램에서 대화를 나누며 범죄를 저지르거나 혹은 그 안에서만 특정 범죄를 저질렀다면 이는 사실상 수사를 통해 검거하기 어렵다.
하지만 특정 딥페이크 요구에 대한 댓가로 비트코인이나 계좌거래 혹은 상품권 거래를 통해 금전적인 거래가 이루어졌다면 이를 현금화하는 과정을 충분히 역추적하여 범죄자를 검거할 수 있다.

다음으로, 딥페이크 범죄에 대해 예방이 가능한지에 대한 내용이다.
먼저, 딥페이크를 조사하면서 어떤 식으로 진행되는지 찾아봤다. 구글에 “undress deepfake ai”, ”face swap deepfake”와 같은 키워드를 통해 검색을 진행하면 여러 사이트가 검색 결과로 노출된다. 확인해본 결과, 사이트 상에 일부 금액을 결제하고 특정인의 사진을 업로드하면 서버 내에 있는 모델을 통해 딥페이크 결과물을 받는 식으로 판단된다. 물론 이 방법 외에도 stable diffusion과 같은 생성 모델에 여러 extensions를 설치하여 진행하는 사례도 있는 것으로 파악했다.
이러한 딥페이크는 단 한 장의 사진으로도 충분히 이루어질 수 있기 때문에 SNS에 사진이 한 장이라도 공개되어 있다면 본질적으로는 딥페이크를 예방하기란 사실상 불가능에 가깝다. 심지어 개인이 딥페이크를 범죄를 저지르고 소장만 하고 있다면 아무리 법적인 장치로 처벌을 한다하더라도 사실상 검거가 어렵다. 하지만 인공지능을 공부하는 사람의 관점에서 그나마 예방할 수 있는 방법을 제시한다면, 가급적 SNS 상에 올릴 때 전신 사진 혹은 정면이 잘 보이는 사진을 업로드하는 것은 주의하거나 스노우 어플 등을 활용하여 필터를 사용하는 것을 방법으로 들 수 있다. 대부분의 합성을 위한 모델은 정면의 얼굴을 그대로 불러와 기존에 있는 이미지에 최대한 자연스럽게 다시 생성하는 방식이기 때문에 얼굴의 각도를 다르게하거나 이미지의 해상도가 낮거나 이미지에 필터를 사용할 경우 딥페이크 생성을 교란할 수 있는 효과가 있기 때문이다.