일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

삼성리서치, 컴퓨터 비전 분야 세계적 학술대회 ‘CVPR 2022’서 논문 20편 채택 성과

2022/06/15

본문듣기 AUDIO Play

공유하기 공유 레이어 열기

공유 레이어 열기/닫기

삼성전자 DX(Device eXperience) 부문의 선행 연구개발 조직인 삼성리서치가 컴퓨터 비전 분야 세계적 학술대회인 CVPR(Computer Vision and Pattern Recognition, 국제 컴퓨터비전·패턴인식 학술대회) 2022에서 총 20편의 논문을 발표한다.

CVPR은 국제전기전자공학회(IEEE)와 국제컴퓨터비전재단(CVF)이 1983년부터 공동 주최하는 대표적인 인공지능(Artificial Intelligence, AI) 국제 학술대회로, ICCV^[1], ECCV^[2]와 함께 컴퓨터 비전 분야의 3대 학회로 꼽힌다. 올해는 6월 19일부터 24일(현지시간)까지 미국 루이지애나주 뉴올리언스에서 온·오프라인을 병행해 개최된다.

삼성리서치 토론토 AI센터에서 제출한 논문은 2020년에 이어 올해는 두 편이 구두 발표 논문으로 선정되는 성과를 거뒀다. CVPR은 통상 상위 4~5%에 해당하는 우수 논문에만 구두 발표 기회를 제공한다.

토론토 AI센터에서 제출한 구두 발표 논문 중 첫 번째, ‘약한 지도 방식을 이용한 학습 영상의 확률적 절차 계획(P³IV: Probabilistic Procedure Planning from Instructional Videos with Weak Supervision)’은 차세대 AI 시스템 구축에 필요한 연구다. ‘절차 계획’은 인간 행동을 분석하고 모방하는 AI 연구에 있어 매우 중요하다. 특히, 요리나 제품 설치, 수리 같은 목표 지향적인 문제 해결에서 주목받고 있다.

이번 연구에서는 ‘요리’ 같은 학습 영상에서 각 단계의 구간 시간을 일일이 입력하는 수고를 줄였다. 인터넷 등에서 발췌된 자연어와 이미지의 조합을 AI가 학습하여 중간 절차들을 자동 예측하고, 확률 모델로 불확실성도 보완하는 방식을 제시한 것. 삼성리서치의 AI 기술 리더십을 다시 한번 입증했다는 평가다.

▲삼성리서치 토론토 AI 센터의 발표 논문 ‘약한 지도 방식을 이용한 학습 영상의 확률적 절차 계획’ 내용의 일부

토론토 AI센터의 두 번째 구두 발표 논문은 ‘야간 신경 ISP 훈련을 위한 야간 영상 합성(Day-to-Night Image Synthesis for Training Nighttime Neural ISPs)’ 연구다. 이는 스마트폰 카메라 나이트 모드의 신경 이미지 시그널 프로세서(ISP)에 필요한 야간 이미지 학습 데이터를 획득하는 방법에 관한 것으로, 깨끗한 이미지를 쉽게 얻을 수 있는 낮 시간에 촬영한 이미지들을 야간 이미지로 변환하는 기술이다.

▲ 삼성리서치 토론토 AI 센터의 발표 논문 ‘야간 신경 ISP 훈련을 위한 야간 영상 합성’ 내용의 일부

모스크바, 케임브리지, 뉴욕 등 글로벌 AI센터에서 제출한 논문도 많은 관심을 받았다.

모스크바 AI센터에서 제출한 두 편의 논문이 채택됐는데, 첫 번째는 싱글 뷰 깊이 추정(Single-View Depth Estimation, SVDE)에 대한 연구다. 이미지를 조작, 생성, 분석하는 컴퓨터 비전의 주요 분야 중 하나인 ‘깊이 추정(Depth Estimation)’ 연구에 새로운 방식을 제시해 더욱 의미 있다. 이번에 발표한 GP2(General-Purpose and Geometry-Preserving) SVDE방식은 기존 연구에서 필요로 하는 자원 집약적인 후처리(Resource-intensive post-processing) 과정 없이도 보다 높은 정확도와 성능을 보여 이목을 끌었다.

두 번째 논문 ‘다층 이미지를 사용한 스테레오 확대(Stereo Magnification with Multi-Layer Images)’는 3D 사진 합성 방법에 관한 연구다. 기존의 3D 사진 합성 방식은 고용량의 메모리와 처리 성능을 필요로 했다. 이번 논문에서 제시한 방식은 모바일 환경에도 적용이 가능하다. 또한, 높은 정확도와 렌더링 성능을 구현해 학계의 주목을 받았다.

케임브리지 AI센터는 “‘변이 오토인코더’^[3]추론 성능을 개선하는 ‘가우시안 프로세스’^[4]모델링 기법” 논문과 대량 데이터 기반으로 잘 학습된 AI 모델 적용을 통해 “‘퓨샷 러닝’^[5]의 성능을 개선할 수 있는 단순 파이프라인 한계의 극복” 논문을 발표했다. 연구진은 새로운 접근 방식을 통해 기존 최신 기술 대비 더 높은 성능을 달성하는 성과를 거뒀다.

이 외에도, 올해 CVPR에서 삼성리서치 플랫폼팀과 삼성리서치 인도 연구소 비쥬얼 인텔리전스팀에서 제출한 논문이 채택되는 등 컴퓨터 비전 분야 AI 연구의 우수성을 입증했다.

삼성리서치는 서울을 비롯해 미국 실리콘밸리·뉴욕, 영국 케임브리지, 캐나다 토론토·몬트리올, 러시아 모스크바 등 전세계 7개 지역에 AI 연구센터를 운영하며, AI 분야 선행 기술 연구에 매진하고 있다.

[1]ICCV(IEEE International Conference on Computer Vision)

[2]ECCV(European Conference on Computer Vision)

[3]입력 정보를 압축하는 인코더와 압축 정보를 복원해 출력하는 디코더가 순차적으로 연결된 구조라는 측면에서 오토인코더의 일종이며, 출력하는 정보를 잠재적 변수의 확률 분포로 표현하는 기법. 대표적 ‘생성적 머신러닝’ 기술로, 압축된 정보에 변이를 가해 입력된 데이터와 다른 새로운 데이터를 출력할 수 있다.

[4]훈련된 데이터에 처음부터 불확실성을 부여하는 방법으로, 복잡한 데이터를 여러 개의 가우시안 분포를 가지는 함수로 근사하는 기법

[5]라벨이 있는 데이터가 적은 상황에서 활용되는 대표적인 AI모델 학습 방식

TAGSAI AI와 미래기술 CVPR 2022 삼성리서치

삼성전자 뉴스룸의 직접 제작한 기사와 이미지는 누구나 자유롭게 사용하실 수 있습니다.
그러나 삼성전자 뉴스룸이 제공받은 일부 기사와 이미지는 사용에 제한이 있습니다.
<삼성전자 뉴스룸 콘텐츠 이용에 대한 안내 바로가기>