[릴레이 인터뷰로 만나는 미래 기술] ③ AI 기술의 토대, 머신러닝을 연구하다… 삼성리서치 중국 베이징 연구소
(2편에 이어)
뉴스룸은 삼성리서치 해외연구소 6곳의 연구원들을 차례로 만나 삼성전자 제품 경쟁력의 밑바탕인 차세대 기술과 연구 분야, 그리고 이들의 연구가 보다 나은 삶을 위해 어떻게 기여하고 있는지를 소개한다.
릴레이 인터뷰에서 소개할 세 번째 전문가는 삼성전자 중국 베이징 연구소(Samsung R&D Institute China–Beijing, SRC-B)의 인공지능(AI) 랩 엔지니어 빈 다이(Bin Dai)이다. 빈은 2020년에 베이징 연구소에 합류해, 네트워크 압축(Network Compression)과 온 디바이스(On-Device) 모델 설계에 대한 연구를 활발히 이어오고 있다. 빈이 근무하고 있는 AI 랩에 대해 아래 일문일답으로 자세히 소개한다.
Q: 자연어 처리와 청각 지능을 포함한 AI 기술은 혁신을 거듭하고 있는 최첨단 연구 분야다. 이러한 혁신 속에서 머신러닝은 어떤 역할을 하나?
머신러닝은 모든 종류의 기술을 사용자에게 직접 전달하는 데 필수적인 역할을 한다. 컴퓨터 비전과 음성 언어 인식은 현재 AI를 활용하는 가장 성공적인 분야지만, 기존 AI 알고리즘은 막대한 연산 자원을 요구하기 때문에 모바일 기기에 탑재하기 어렵다는 한계도 있다. 이러한 문제를 해결하기 위해, 우리 연구소에서는 머신러닝을 활용해 강력한 성능을 내는 경량화 모델을 연구하고 있다. 이는 AI에 기반을 둔 모든 기술의 혁신에 기여할 것으로 본다.
Q: 베이징 연구소에 대해 소개 부탁한다.
베이징 연구소는 2000년 최초로 설립된 중국 내 삼성전자 연구소다. 우리 연구소는 머신러닝, 컴퓨터 비전, 언어 처리, 음성 지능 같은 AI 연구와 3GPP 표준화 등의 차세대 통신 연구에 특화돼 있다. 2019년 4월, 머신러닝에 대한 근본적 연구를 위해 인공지능 랩을 설립했고, 연구 성과를 삼성전자 제품에 적용하기 위해 노력하고 있다. 이 외에도, 긴밀한 현지 산학 협력도 이어가고 있다.
Q: 맡고 있는 주요 연구 과제에 대해 소개해달라.
우리의 연구 목표는 기존 AI 알고리즘의 연산 복잡도와 리소스를 줄이면서도 정확도를 높이기 위한 최적의 방법을 찾는 것이다. 이를 위해, 데이터가 적은 상황에서도 보다 정확한 예측을 가능케 하는 머신러닝 연구인 ‘등변 네트워크(Equivariant Network)’와 ‘동적 추론(Dynamic Inference)’을 소개하겠다.
등변 네트워크는 기하학적 구조를 활용하는 딥러닝(Geometric Deep Learning) 분야 중 하나다. 컴퓨터 비전 데이터셋에는 이미지뿐만 아니라 사람의 눈처럼 거리까지 측정해내는 LiDAR 포인트 클라우드(LiDAR Point Cloud)를 비롯, 여러 종류의 대칭성(Symmetry)을 가지는 특성이 존재한다. 등변 네트워크를 사용하면, 이러한 대칭성을 고려해 네트워크를 설계할 수 있다. 특히 데이터셋의 본질적 구조를 생각했기 때문에, 결과적으로 적은 컴퓨팅 자원과 데이터로도 좋은 성능을 내는 것이 가능하다.
동적 추론 (Dynamic inference)도 매우 흥미로운 연구 중 하나다. 모든 데이터 샘플에 고정 아키텍처를 사용하는 전통적 방법과 달리, 동적 추론은 각 데이터 샘플에 얼마나 많은 자원을 사용할지 유동적으로 결정할 수 있다. 때문에, 단순한 샘플에는 적은 연산 자원을 사용하고, 어려운 샘플에는 더 많은 자원을 사용해, 평균 연산 자원을 크게 줄일 수 있다.
Q: 컴퓨터 비전에서 음성언어 인식에 이르기까지 AI가 어떻게 사용자 응용 분야에 기여 했는지 궁금하다. 모바일 경험 최적화를 위해 인공지능 랩에서 수행하고 있는 연구 방향도 설명해달라.
우리는 대량의 데이터 속에서 살고 있다. 데이터가 있는 곳에 지식도 있다. AI 알고리즘은 데이터 속 숨은 지식을 찾아내고, 그 지식을 활용해 우리 삶을 편리하게 해주는 최고의 도구가 되어 준다.
베이징 연구소는 입력된 정보들을 자동으로 필터링하여 필요한 부분만을 남기는 ‘정보 병목 현상 이론 (Information Bottleneck Theory)’에 기반한 네트워크 압축 알고리즘을 개발했다. 이는 동영상 인식, 이미지 분할, 기계 번역 등 다양한 작업에 응용돼 왔다.
이 외에도, 인공 신경 구조망 설계를 자동화하는 신경 구조망 탐색(Neural Architecture Search, NAS)과 다양한 디바이스 환경에 최적화된 모델을 자동 생성하는 OFA(Once-For-All) 솔루션을 비롯해, 더 강력한 AI 알고리즘을 개발하기 위해 다른 랩들과 적극적으로 협업을 이어나가고 있다.
Q: 모바일 기반 기술을 머신 러닝 기반 AI 기술과 통합한다면, 사용자는 어떤 편리함을 누릴 수 있나?
크게 세 가지로 말할 수 있다. 첫 번째는 AI 기술만이 제공할 수 있는 편리한 기능들이 있다. 예를 들어, 모바일 기기의 ‘자동 질문 대답 시스템’은 AI 알고리즘이 있어야만 가능하다. 전통적 방식에서는 매우 제한적인, 정해진 질문만 처리할 수 있다.
두 번째는, 전통적 기술을 사용할 때에 비해 향상된 애플리케이션의 성능을 누릴 수 있다. 예를 들어, 카메라의 뉴럴 이미지 신호 처리(Neural Image Signal Processing) 기능에 딥 뉴럴 네트워크(Deep Neural Network)를 적용하면 훨씬 더 좋은 사진을 얻을 수 있다.
세 번째는, 사용자들도 미처 깨닫지 못했던 사용자 맞춤 서비스를 제공할 수 있다. AI는 사용자의 취향을 토대로 ‘사용자 특화 소프트웨어 개발’을 가능케 하고, 이를 통해 사용자들이 더 편리하게 기기를 사용할 수 있게 지속적으로 돕는다.
Q: 베이징 연구소 내 다른 팀, 더 나아가 전 세계 다른 연구소와의 협업은 어떤 시너지를 내나? 또, 사용자의 삶을 더 편리하게 만들기 위해 어떤 연구들이 이뤄지는지도 궁금하다.
우리 인공지능 랩은 베이징 연구소 내 다른 팀들과 협업하고 있다. 최근에는 비주얼 컴퓨팅(Visual Computing) 팀과 협업했다. 동영상 인식 작업, 이미지 내 인물을 인식하고 배경과 분리하는 인체 분할(Human Segmentation) 작업에 ‘병목 현상 기반 압축 알고리즘’을 적용하는 프로젝트였다. 그 결과, 성능 저하 없이 모델 크기를 현저하게 줄이는 성과를 얻었다. 2021년에는 이 솔루션을 가지고 단일팀으로 ‘컴퓨터 비전과 패턴 인식 콘퍼런스(Conference on Computer Vision and Pattern Recognition, CVPR)’의 ’신경구조망 탐색(NAS) 대회’에 참가해 우승도 거뒀다.
언어 지능(Language Intelligence) 팀의 기계 번역 모델을 압축하기 위한 협업도 진행 중이다. 연구 성과가 나온다면 모델의 상용화를 앞당길 수 있다. 전 세계 AI 센터와 더 많이 소통하고 협업한다면 더 좋은 연구와 응용 성과를 낼 수 있다고 확신한다.
Q: 현재 업계의 주요 트렌드는 무엇인가? 이러한 트렌드를 삼성전자 중국 베이징 연구소에서 수행하고 있는 연구에 어떻게 통합하고 있는지도 궁금하다.
현재 업계에서는 효율적 네트워크 아키텍처 설계(Efficient Network Architecture Design), 자기 감독 학습(Self-supervised Learning), 그래프 신경망(Graph Neural Network) 등 다양한 기술이 논의되고 있다. 우리 연구소는 그중 ‘네트워크 압축’과 ‘경량화 모델 설계’에 주력하고 있다. 이는 모바일 기기 앱에 큰 영향을 미치는 기술이다. 매우 제한적인 연산 자원을 가진 모바일 기기에는 다양한 서비스를 제공할 수 있는 대형 모델을 탑재하기 어렵다. 때문에, 이러한 기기에 적합한 모델을 설계하는 데에 집중하고 있다.
이처럼 모바일에 어울리는 가볍고도 강력한 모델을 개발하기 위해서 다양한 방법론이 논의되고 있다. 우리 연구소 외에도 업계의 다양한 분야에서 이 목적을 달성하기 위해 네트워크 프루닝(Network Pruning), 모델 양자화(Quantization), 지식 증류(Knowledge Distillation), 신경망 아키텍처 검색(Neural Network Architecture Search), 동적 추론(Dynamic Inference) 등의 분야를 활발히 연구 중이다.
Q: 가장 자랑스럽게 여기는 성과를 소개해달라.
커뮤니케이션 연구팀과 협업해 무선통신용 AI 알고리즘을 개발했다. 해당 솔루션으로 올해 ‘무선통신 AI 경진대회(Wireless Communication AI Competition, WAIC)’에서 우승도 거뒀다. 중국 정보통신기술연구원(China Academy of Information and Communication Technology, CAICT)에서 주최한 대회인데, 전 세계 600여 개 팀이 참여하는 5G, AI 경진대회다.
개인적으로 매우 자랑스럽기도 했고, AI와 결합한 5G가 잠재력이 큰 연구 방향임을 입증한 거 같아 기분이 좋았다.
※ 삼성리서치 러시아 ‘예브게니 파블로프’ 연구원과의 인터뷰와 질문에 대한 답변은 4편에서 만날 수 있습니다.
삼성전자 뉴스룸의 직접 제작한 기사와 이미지는 누구나 자유롭게 사용하실 수 있습니다.
그러나 삼성전자 뉴스룸이 제공받은 일부 기사와 이미지는 사용에 제한이 있습니다.
<삼성전자 뉴스룸 콘텐츠 이용에 대한 안내 바로가기>