데이터 분석, 이제 ‘남 일’ 아니고 내 일!
바야흐로 빅데이터 시대다. 우리의 일상과 업무에 관련된 다양한 정보는 매 순간 데이터로 기록된다. 내가 어딜 가는지, 무얼 사고, 누굴 만나는지에 대한 모든 게 모바일 디바이스와 생활 속 주변 기기를 통해 저장된다. 모든 게 데이터화(化)되는 시대엔 개인·기업·정부가 비교적 쉽게 대량의 데이터를 손에 넣을 수 있다. 전문직에 종사하는 사람이 아니라도 수없이 만들어지는 데이터를 이해하고 활용할 줄 아는 힘, 즉 데이터 분석력은 중요해졌다.
“데이터를 쌓을 줄만 아는 사람 Vs 데이터를 읽고 해석할 줄 아는 사람”
“과거에 데이터 분석은 전문가들만이 다루는 분야였어요. 그런데 이젠 아니에요. 직장인들과 학생들이 회사 업무와 학업을 수행하는 데 있어 각종 데이터를 다양하게 활용하죠. 그 추세는 앞으로 계속 될 거예요.”
데이터 분석 전문가인 이토 고이치로 미국 시카고대 해리스스쿨 교수는 현대사회를 살아가면서 가장 필요한 능력 중 하나로 데이터 분석력을 꼽는다. 그는 실증 연구와 데이터 분석을 통한 ‘현실밀착형 데이터 분석’으로 주목받는 젊은 경제학자다. 중국인들은 미세먼지 1마이크로그램을 줄이는데 얼마를 지불할 용의가 있는지, 부족한 전력 공급 문제를 해결하기 위해 일본 정부가 전력 가격을 얼마나 올려야 절전 효과를 얻을 수 있을지 등의 실험 분석 결과를 논문으로 발표하면서, 숫자에 불과한 데이터가 어떻게 똑똑한 전략과 정책이 되는지를 증명해내고 있다.
그의 책 《데이터 분석의 힘》은 데이터 분석이란 세계에 입문하려는 일반인을 위한 책이다. 그가 시카고 대학교 대학원생들에게 가르치고 있는 수업 내용을 이해하기 쉽게 해설해 펴낸 것으로 학계와 대중 모두에게 호평을 받았다. 일본에서만 8만부 이상이 팔렸으며 아마존 재팬 경제 분야 1위를 오래 차지했다. 지난해 국내에서도 번역돼 나온 뒤 경제분야 베스트셀러로 단번에 등극했다. 삼성전자 뉴스룸은 미국 시카고에 머물며 강연에 힘쓰고 있는 고이치로 교수와 이메일 인터뷰를 했다. 장문의 인터뷰에서 그는 데이터 분석의 성공요건에 대해 거듭 강조했다.
Q. 데이터 분석은 어디에, 어떻게 활용될 수 있나요?
현대사회에서 데이터가 활용되는 예는 매우 폭넓습니다. 정부에서 환경정책을 결정할 때나 기업을 운영하면서 에너지 정책을 고민할 때, 심지어 아울렛에 어떤 상품을 들여오고 매장 진열대에 상품을 어떻게 놓을지 등을 고민할 때에도 올바르게 데이터를 해석할 줄 안다면 큰 도움이 됩니다. 소비, 마케팅, 금융, 인적 자원 활용 등 비즈니스 영역뿐만 아니라 범죄 심리학, 교통·교역·환경 정책 등 정책적 영역까지 다양한 분야와 장소에서 데이터 분석이 이용되고 있습니다.
실제로 제가 몸 담고 있는 시카고 대학이나 미국 유수의 대학들은 지역공동체나 글로벌 기업들과의 다양한 데이터 분석 프로젝트를 협력해 수행하곤 합니다. 이렇게 나온 분석을 기반으로 기업들은 더 효율적으로 시장을 공략하고, 지역사회의 원활한 운영을 도모하는 것이죠. 데이터 분석은 점점 더 많은 영역과 협업을 이어가고 있습니다.
Q. 비전문가까지 숫자나 데이터를 처리하고 읽을 수 있어야 할까요?
데이터 분석은 데이터 과학자로 일할 필요가 없는 많은 사람들에게조차 직업의 핵심 부분이 됐어요. 문·이과를 가릴 것 없이 필요한 능력이 됐죠. 스스로 데이터를 사용하는 것도 중요하지만, 데이터 과학자가 만든 보고서를 이해하기 위해서라도 데이터 분석에 대한 기본 지식을 가질 필요가 있어요.
Q. 책 내용 중 “데이터에서 단순한 상관관계를 넘어 인과관계를 도출하는 게 중요하다”는 언급이 있어요. 헌데, 많은 사람들이 종종 단순 상관관계를 인과관계로 확대 해석하기도 하죠
상관관계가 반드시 인과관계를 의미하는 건 아니에요. 예를 들어, X(광고)와 Y(판매량)는 긍정적인 상관관계가 있지만 인과관계는 없다고 가정해봅시다. 광고에 돈을 썼을 때 결과적으로 판매량이 늘어나긴 했지만, 광고에 돈을 쓰면 반드시 매출이 느는 건 아니란 뜻이에요. 만약 이 관계를 잘못 이해했다면 과도한 혹은 부적절한 광고비 집행이 일어날 수 있겠죠. 단순 상관관계를 인과관계로 확대 해석하는 건 잘못된 선택을 이끌기도 한다는 점에서, 이 둘을 구별하는 게 중요합니다.
결국 중요한 건 ‘인과관계 분석’이랍니다. 인과관계의 분석은 데이터 분석법의 가장 기본이라고 할 수 있어요. X라는 정책이 Y라는 결과에 어떤 영향을 미쳤는지 인과관계를 과학적으로 보여주는 데이터 분석이야말로 우리의 정책 형성에 필요하죠. 데이터 분석 전문가가 필요한 이유고요. 무작위비교시행(RCT)[1], 회귀불연속설계법[2], 집군분석[3], 패널데이터분석[4] 등 여러 가지 데이터 분석 방법이 있죠. 하지만 비전문가에겐 복잡한 수식보다 ‘직관적 사고법’이 더 중요하긴 합니다. 직관적 사고법을 익히기 위해선 평소 데이터를 눈여겨보고, 그게 단순 상관관계인지 아니면 인과관계가 있는지 생각해 보는 훈련이 필요합니다.
Q. 데이터 분석을 성공적으로 이끌어내려면 무엇이 필요한가요?
성공적인 데이터 분석은 첫 번째로 ‘잘 정의된 질문’에서 출발합니다. 그리고 ‘고품질 데이터’가 뒷받침돼야 하죠. 여기에 ‘데이터 과학자로서의 적절한 기술’이 더해진다면 더할 나위 없습니다.
여기에 좀 더 보탠다면, 당신이 비전문가일 땐 데이터 분석 전문가와 협력관계를 구축하는 게 굉장히 큰 도움이 될 거예요. 데이터 전문가와 비전문가의 협력은 엄청난 시너지를 일으킵니다. 단순히 데이터만 분석할 줄 아는 전문가는 현장의 목소리를 듣지 못하거나, 실질적인 문제를 체감하지 못하거든요. 반면, 데이터 분석에 익숙하지 않은 비전문가는 수많은 숫자를 놓고 어디서부터 손을 대야 할지 모르고요. 데이터 전문가와 비전문가가 협력할 때 유의미한 사회적 메시지를 이끌어낼 수 있습니다.
Q. 늘 새로운 걸 받아들일 준비가 돼있는 뉴스룸 독자들에게 한마디 부탁 드립니다
제가 즐겨 쓰는 비유인데요. 데이터 분석은 ‘초밥 만들기’와 같습니다. 같은 재료를 사용해도 장인(匠人)이 만든 초밥이 더 맛있는 까닭, 뭐라고 생각하시나요? 맛있는 초밥을 만들려면 세 가지가 필요하다고 합니다. 첫 번째는 훌륭한 재료를 준비하는 일, 두 번째는 감칠맛을 살릴 칼 솜씨를 갖추는 일, 마지막 세 번째는 눈앞의 손님이 바라는 맛이나 요리를 제공하는 겁니다.
데이터 분석도 마찬가지예요. 정보통신 혁명 덕에 많은 사람들이 비교적 쉽게 좋은 데이터(재료)를 손에 넣게 됐어요. 하지만 데이터를 어떤 각도로 자를지 결정하는 감각이나 사고법을 익히지 않으면 애써 구한 재료를 살릴 수 없겠죠. 또 아무리 멋지게 데이터를 분석했더라도 질문에 답을 주지 못한다면? 그건 빛 좋은 개살구에 불과합니다.
빅데이터를 처리, 분석, 해석하는 일련의 과정엔 인간의 판단이 중요한 역할을 합니다. 과거엔 단순히 데이터를 집적하는데 몰두했다면, 요즘 IT업계는 이를 읽어내는 분석력이 중요하다고 인식하고 있죠. 기업과 정부의 정책결정자들에게 데이터를 안전하게 수집·관리하고 제공하는 방법은 여전히 어려운 문제예요. 그럼에도 많은 기업과 규제 당국은 현재 이 과제를 해결하고 유용한 데이터를 활용하는 방법에 대해 연구하고 있습니다. 앞으로 데이터를 분석하는 기본 기술은 대부분의 직업에서 중요한 요소가 될 겁니다. 전 젊은 세대에게 이 점을 강조하고 싶어요. 이제 데이터를 분석할 줄 아는 게 곧 ‘힘’입니다.
[1] randomized controlled trial. 무작위로 개입·비교 집단을 구성한 뒤 다른 조건은 통제해 인과관계를 분석
[2] 이미 있는 데이터로 실제 실험에 가까운 상황을 이용해 인과관계를 분석
[3] 데이터의 계단식 변화를 이용해 인과관계를 분석
[4] 복수의 집단에 대해 복수의 기간에 걸쳐 데이트를 수집, 분석
삼성전자 뉴스룸의 직접 제작한 기사와 이미지는 누구나 자유롭게 사용하실 수 있습니다.
그러나 삼성전자 뉴스룸이 제공받은 일부 기사와 이미지는 사용에 제한이 있습니다.
<삼성전자 뉴스룸 콘텐츠 이용에 대한 안내 바로가기>