각도가 중요하죠: 당신의 사진, 새로운 구도로 재탄생하다
요약
구글 리서치가 구글 포토의 '자동 프레임' 기능에 도입한 신기술은 3D 장면 이해와 생성형 AI를 활용해 이미 찍은 사진도 새로운 각도로 재구성해 완벽하지 않은 사진을 보정해주는 기능이에요.
인사이트
- AI가 2D 사진을 3D 장면으로 인식하고 가상 카메라 위치를 변경하여, 촬영 후에 새로운 시점으로 사진을 재구성할 수 있게 하는 혁신적인 이미지 편집 기술이에요.
- 이 기술은 3D 장면 및 카메라 추정 단계와 생성형 인페인팅/리터칭 단계로 나뉘어, 3D 공간 조작의 정밀함과 생성형 AI의 창의성을 효과적으로 결합하고 있어요.
- 구글 포토의 '자동 프레임' 기능으로 실제 사용자들에게 제공되어, 인물 사진의 구도 개선이나 광각 렌즈 왜곡 자동 보정 등 일상적인 사진 편집 경험을 한 단계 업그레이드한다는 점이 중요해요.
왜 중요한가
이 기술은 단순한 2D 이미지 조작을 넘어서요. 사진을 3D 장면으로 취급함으로써, 카메라 앵글을 바꾸거나 찍힌 후에 왜곡을 수정하는 등 이전에는 불가능했던 완전히 새로운 사진 편집 가능성을 열어주죠. 덕분에 '거의 완벽했던' 사진들을 진정으로 완벽하게 만들어 사용자 경험을 크게 향상시킬 수 있어요.
각도가 중요하죠: 당신의 사진, 새로운 구도로 재탄생하다
- 구글은 누구인가요
구글은 누구인가요 메뉴로 돌아가기
오늘과 내일의 기술을 정의하다.
* ## 철학
구글 팀은 다양한 시간 규모와 위험 수준에 걸쳐 여러 종류의 연구에 적합한 환경을 조성하기 위해 노력하고 있어요.
구글 팀의 철학에 대해 더 알아보기 철학 * ## 사람들
구글 리서치의 연구원들은 기초 연구와 응용 연구 모두를 통해 컴퓨터 과학 발전을 이끌고 있죠.
- 연구 분야
연구 분야 메뉴로 돌아가기
*
연구 분야
* [모든 연구 분야 살펴보기](https://research.google/research-areas/)
연구 분야
연구 분야 메뉴로 돌아가기
* [모든 연구 분야 살펴보기](https://research.google/research-areas/)
*
기초 ML 및 알고리즘
* [알고리즘 및 이론](https://research.google/research-areas/algorithms-and-theory/)
* [데이터 관리](https://research.google/research-areas/data-management/)
* [데이터 마이닝 및 모델링](https://research.google/research-areas/data-mining-and-modeling/)
* [정보 검색 및 웹](https://research.google/research-areas/information-retrieval-and-the-web/)
* [머신 인텔리전스](https://research.google/research-areas/machine-intelligence/)
* [머신 인식](https://research.google/research-areas/machine-perception/)
* [머신 번역](https://research.google/research-areas/machine-translation/)
* [자연어 처리](https://research.google/research-areas/natural-language-processing/)
* [음성 처리](https://research.google/research-areas/speech-processing/)
기초 ML 및 알고리즘
기초 ML 및 알고리즘 메뉴로 돌아가기
* [알고리즘 및 이론](https://research.google/research-areas/algorithms-and-theory/)
* [데이터 관리](https://research.google/research-areas/data-management/)
* [데이터 마이닝 및 모델링](https://research.google/research-areas/data-mining-and-modeling/)
* [정보 검색 및 웹](https://research.google/research-areas/information-retrieval-and-the-web/)
* [머신 인텔리전스](https://research.google/research-areas/machine-intelligence/)
* [머신 인식](https://research.google/research-areas/machine-perception/)
* [머신 번역](https://research.google/research-areas/machine-translation/)
* [자연어 처리](https://research.google/research-areas/natural-language-processing/)
* [음성 처리](https://research.google/research-areas/speech-processing/)
*
컴퓨팅 시스템 및 양자 AI
* [분산 시스템 및 병렬 컴퓨팅](https://research.google/research-areas/distributed-systems-and-parallel-computing/)
* [하드웨어 및 아키텍처](https://research.google/research-areas/hardware-and-architecture/)
* [모바일 시스템](https://research.google/research-areas/mobile-systems/)
* [네트워킹](https://research.google/research-areas/networking/)
* [양자 컴퓨팅](https://research.google/research-areas/quantum-computing/)
* [로봇 공학](https://research.google/research-areas/robotics/)
* [보안, 개인 정보 보호 및 악용 방지](https://research.google/research-areas/security-privacy-and-abuse-prevention/)
* [소프트웨어 엔지니어링](https://research.google/research-areas/software-engineering/)
* [소프트웨어 시스템](https://research.google/research-areas/software-systems/)
컴퓨팅 시스템 및 양자 AI
컴퓨팅 시스템 및 양자 AI 메뉴로 돌아가기
* [분산 시스템 및 병렬 컴퓨팅](https://research.google/research-areas/distributed-systems-and-parallel-computing/)
* [하드웨어 및 아키텍처](https://research.google/research-areas/hardware-and-architecture/)
* [모바일 시스템](https://research.google/research-areas/mobile-systems/)
* [네트워킹](https://research.google/research-areas/networking/)
* [양자 컴퓨팅](https://research.google/research-areas/quantum-computing/)
* [로봇 공학](https://research.google/research-areas/robotics/)
* [보안, 개인 정보 보호 및 악용 방지](https://research.google/research-areas/security-privacy-and-abuse-prevention/)
* [소프트웨어 엔지니어링](https://research.google/research-areas/software-engineering/)
* [소프트웨어 시스템](https://research.google/research-areas/software-systems/)
*
과학, AI 및 사회
* [기후 및 지속 가능성](https://research.google/research-areas/climate-and-sustainability/)
* [경제학 및 전자 상거래](https://research.google/research-areas/economics-and-electronic-commerce/)
* [교육 혁신](https://research.google/research-areas/education-innovation/)
* [일반 과학](https://research.google/research-areas/general-science/)
* [건강 및 생명 과학](https://research.google/research-areas/health-bioscience/)
* [인간-컴퓨터 상호작용 및 시각화](https://research.google/research-areas/human-computer-interaction-and-visualization/)
* [책임감 있는 AI](https://research.google/research-areas/responsible-ai/)
과학, AI 및 사회
과학, AI 및 사회 메뉴로 돌아가기
* [기후 및 지속 가능성](https://research.google/research-areas/climate-and-sustainability/)
* [경제학 및 전자 상거래](https://research.google/research-areas/economics-and-electronic-commerce/)
* [교육 혁신](https://research.google/research-areas/education-innovation/)
* [일반 과학](https://research.google/research-areas/general-science/)
* [건강 및 생명 과학](https://research.google/research-areas/health-bioscience/)
* [인간-컴퓨터 상호작용 및 시각화](https://research.google/research-areas/human-computer-interaction-and-visualization/)
* [책임감 있는 AI](https://research.google/research-areas/responsible-ai/)
- 구글 팀의 작업
구글 팀의 작업 메뉴로 돌아가기
* ## 프로젝트
구글 팀은 더 넓은 연구 커뮤니티와 정기적으로 프로젝트를 오픈 소스로 공유하고, 개발된 기술을 구글 제품에 적용하고 있어요.
구글 팀의 프로젝트에 대해 더 알아보기 프로젝트 * ## 간행물
구글 팀의 연구 결과를 발표함으로써 아이디어를 공유하고 협력하여 컴퓨터 과학 분야를 발전시킬 수 있어요.
구글 팀의 간행물에 대해 더 알아보기 간행물 * ## 리소스
더 협력적인 생태계를 구축하기 위해, 구글 팀은 제품, 도구 및 데이터셋을 모든 사람에게 제공하고 있어요.
- 프로그램 및 이벤트
프로그램 및 이벤트 메뉴로 돌아가기
함께 미래를 만들어가요.
구글 팀과 협력하기 * ## 학생 프로그램
다양한 프로그램을 통해 차세대 연구원들을 지원하고 있어요.
구글 팀의 학생 프로그램에 대해 더 알아보기 학생 프로그램 * ## 교수 프로그램
대학교 교수들과의 의미 있는 교류를 통해 학술 연구 커뮤니티에 참여하고 있어요.
구글 팀의 교수 프로그램에 대해 더 알아보기 교수 프로그램 * ## 컨퍼런스 및 이벤트
이벤트를 통해 더 넓은 연구 커뮤니티와 소통하는 것은 구글 팀의 모든 작업에서 발전을 이루는 데 필수적이에요.
구글 팀의 컨퍼런스 및 이벤트에 대해 더 알아보기 컨퍼런스 및 이벤트
검색
소리 없는 반복 동영상 재생 소리 없는 반복 동영상 일시 중지
동영상 음소거 해제 동영상 음소거
각도가 중요하죠: 당신의 사진, 새로운 구도로 재탄생하다
2026년 4월 22일
Marcos Seefelder, 플랫폼 및 기기 담당 스태프 소프트웨어 엔지니어, Pedro Velez, Google Deepmind 선임 리서치 엔지니어
구글 리서치 팀은 이미지 편집을 위한 새로운 접근 방식을 선보였어요. 이 방식은 현재 구글 포토의 자동 프레임 기능에 적용되어, 사용자들이 사진을 찍은 후에도 새로운 시점으로 재구성할 수 있게 해줘요.
빠른 링크
카메라 롤을 뒤적이다가 '아, 이때 장면을 조금 다르게 찍었더라면' 하고 아쉬워했던 적 없으신가요? 어쩌면 얼굴 한쪽을 조금 더 담고 싶었거나, 완벽한 구도를 위해 카메라를 살짝 더 낮췄으면 좋았을 수도 있죠. 아니면 완벽한 미소의 셀카인데, 광각 렌즈 때문에 내 모습이 좀 낯설게 보일 수도 있구요. 보통 이런 사진들은 "거의 완벽했지만" 그냥 만족하고 넘어가는 경우가 많아요. 왜냐하면 그 순간은 이미 지나갔고, 다시 찍을 수 없기 때문이죠.
자르고 확대하는 게 도움이 될 수는 있지만, 기존의 이미지 편집 도구들은 근본적인 문제를 해결해주지 못해요. 이미지는 여전히 고정된, 완벽하지 않은 시점에서 장면을 보여주고 있거든요. 확대해도 시차는 변하지 않고, 자르기만으로는 프레임 밖에 있던 것을 보여줄 수 없으니까요.
오늘 구글 리서치 팀은 사진이 찍힌 후에 장면 정렬을 수정하는 새로운 접근 방식을 발표합니다. 이 방법은 현재 구글 포토의 자동 프레임 기능의 일부로 제공되고 있는데요, 머신러닝(ML) 모델을 사용해 장면과 공간적 배치를 이해하고, 생성형 AI를 활용해 새로운 관점에서 사진을 상상해내요. 기존 사진 편집과는 다르게, 이 방법은 사진을 3D 장면으로 해석해요. 마치 시간이 멈춘 실제 순간처럼 말이죠. 그리고 그 공간 안에서 카메라 위치를 자동으로 바꿔줍니다. 이를 통해 원래 보이던 내용은 유지하면서도, 이전에 숨겨져 있던 내용을 지능적으로 생성하여 원본 장면에 대한 진정성 있는 새로운 시점을 만들어내는 거죠.
SPOON_MEDIA_PLACEHOLDER_0
새로운 자동 프레임 기능은 일반적인 2D 사진을 3D 장면으로 해석해요. 이미지의 공간적 배치를 통해 원본 카메라 위치를 추론함으로써, 자동으로 각도를 수정하여 시간이 멈춘 순간의 새롭고 진정성 있는 시점을 보여줘요.
새로운 시점
다른 생성형 이미지 편집 솔루션들과는 다르게, 구글 팀의 방법은 두 단계로 구성되어 있어요. 첫 번째는 3D 장면 및 카메라 추정이고, 두 번째는 생성형 인페인팅(inpainting) 및 리터칭이에요. 3D 추정을 이미지 형성 과정에서 분리함으로써, 구글 팀은 3D로 장면을 충실하게 조작하고 카메라 내부 및 외부 파라미터를 모두 조정할 수 있죠. 더 나아가, ML 모델을 활용해 장면 내용을 이해하고 새로운 카메라 파라미터를 자동으로 제안해요.
첫 번째 단계에서는, 구글 팀이 내부 3D 포인트 맵 추정 모델을 사용해요. 이 모델은 사람의 신체와 얼굴을 충실하게 재구성하고, 신원 보존에 해를 끼칠 수 있는 재구성 아티팩트를 제한하도록 특별히 구성되었죠. 원본 이미지의 모든 픽셀에 대해 이 모델은 보이는 표면 패치를 나타내는 3D 포인트를 추정하고, 추가로 원본 카메라의 초점 거리를 근사해요.
다음으로, 구글 팀은 클래식 3D 렌더링을 사용해 변경된 카메라 파라미터로 촬영된 것처럼 이미지 추정치를 생성해요. 중요한 점은, 카메라 포즈(위치와 방향)와 초점 거리 모두를 수정할 수 있어서 이미지 형성 과정에 대한 완전한 제어가 가능하다는 것이죠.
하지만 3D 포인트 맵만으로는 충분하지 않아요. 가상 카메라를 객체 "주변"으로 움직이면 원본 렌즈에는 잡히지 않았던 배경 부분이 드러나거든요. 기본적으로 포인트 맵은 장면의 불완전한 표현이고, 새로운 시점에서 렌더링하면 항상 "구멍"이 생기게 돼요. 이 영역들을 채우기 위해, 구글 팀은 생성형 잠재 확산 모델을 사용해 렌더링된 추정치를 완성하고 수정해요. 이 모델은 알려진 카메라 파라미터를 가진 이미지 쌍의 내부 데이터셋을 사용해 이 작업을 위해 특별히 훈련되었어요. 훈련 중에는 한 이미지의 3D 포인트 맵을 추정하고 이를 두 번째 이미지의 카메라로 투영해요. 그러면 모델은 재렌더링된 첫 번째 이미지로부터 두 번째 이미지를 재구성하는 것을 학습하죠. 추론 시에는, 구글 팀은 지역 스케일링을 사용한 분류기 가이던스를 적용해서 원본 내용을 충실하게 보존하는 동시에, 모델이 빈 공간을 채울 창의적인 자유를 갖도록 했어요.

구글 팀의 두 단계 편집 방법 개요에요. 먼저, 3D 포인트 맵 추정 모델이 모노큘러 깊이를 사용해 3D 포인트 맵을 생성하고, 2D 의미 정보를 이용해 목표 카메라 파라미터를 추론함으로써 장면의 기하학적 구조를 추정해요. 둘째, 생성형 잠재 확산 모델이 숨겨진 배경 영역을 채우고 새로운 카메라 앵글로 드러난 새로운 시점에 대한 최종 조정을 수행하여 구성을 완성해요.
더 나은 시점
완전 자동 편집을 지원하기 위해, 구글 팀은 ML 모델을 활용해 주요 피사체의 얼굴 위치와 3D 방향을 감지해요. 3D 포인트 맵과 함께, 이 의미 정보는 이상적인 프레이밍을 위한 카메라 파라미터를 계산할 수 있게 해주죠. 이는 인물 사진에 특히 유용해요. 또한, 광각 전면 카메라로 촬영된 이미지는 종종 강한 원근 왜곡으로 인해 렌즈에 가장 가까운 특징들이 비정상적으로 크게 보일 수 있어요. 이를 위해 구글 팀의 방법은 이러한 왜곡을 자동으로 감지하고 가상 카메라 내부 파라미터를 조정하여 자연스럽고 보기 좋은 비율을 복원함으로써, 사실상 촬영 후에 피사체로부터 "뒤로 물러나는" 효과를 내요.
SPOON_MEDIA_PLACEHOLDER_1
이제 구글 포토에서 사용 가능해요
이 완전 자동 솔루션은 이제 구글 포토의 자동 프레임 기능의 일부로 라이브되고 있어요. 구글 팀의 3D 인식 이미지 편집 도구를 사용하여 인물이 포함된 적격 사진을 처리함으로써 인물 사진을 매끄럽게 향상시켜주죠. 사용자들은 자동으로 조정된 카메라 시점을 가진 재구성된 이미지를 자동 프레임 후보 중 두 번째 렌더링 옵션으로 접근할 수 있어서, 사진을 한 번의 동작으로 개선할 수 있어요.
SPOON_MEDIA_PLACEHOLDER_2
이제 구글 포토에 적용된 이 편집 도구는 사용자가 자동 프레임 기능 내에서 자동으로 재구성된 이미지를 매끄럽고 한 번의 동작으로 손쉽게 사용할 수 있게 해줘요.
감사 말씀
이 기능은 Google DeepMind와 Google Platforms & Devices 팀 간의 협업으로 이루어졌습니다. 주요 기여자들은 다음과 같습니다: Thiemo Alldieck, Marcos Seefelder, Hannah Woods, Pedro Velez, Michael Milne, Bert Le, Navin Sarma, Jasmin Repenning, Selena Shang. 자문 위원들은 다음과 같습니다: Steven Hickson, Claudio Martella, Irfan Essa, Alex Rav Acha. 특별히 다음 분들께 감사드립니다: Mike Krainin, Jan Stria, Neal Wadhwa, Amit Raj, Mauro Rego, Kita Boice, Dennis Shtatnov, Yuan Qi, Julian Iseringhausen, Peter Zhizhin, Jiaping Zhao, Andre Araujo, Jana Ehmann, Keng-Sheng Lin, Isalo Montacute, Brandon Ruffin, Reginald Ballesteros, Andy Radin.
태그:
빠른 링크
관심 있을 만한 다른 게시물
2026년 4월 21일 ReasoningBank: 에이전트가 경험으로부터 학습할 수 있도록 돕기 * 생성형 AI · * 머신 인텔리전스 · * 자연어 처리
2026년 4월 16일 현실 세계를 위한 합성 데이터셋 설계: 메커니즘 설계 및 제1원칙 추론 * 생성형 AI · * 머신 인텔리전스 · * 자연어 처리
2026년 4월 13일 생성형 AI로 미래 대비 능력 개발하기 * 교육 혁신 · * 생성형 AI
×❮❯

구글을 팔로우하세요
피드백 보내기
×