Blog

방대한 데이터를 니즈에 맞게 수집&분석하는 데이터분석팀 리더 하록 인터뷰

우리는 빅데이터 시대라고 불릴 정도로 방대한 데이터 속에 살아가고 있습니다. 하지만 수많은 데이터가 쌓이지 않고 의미 없이 흘러간다면 어떨까요? 그것은 데이터라 부르지도 못하는 상태로 증발해 버리는 것이 됩니다. 오늘은 그런 데이터에 유효한 가치를 부여하여 잘 쌓이고 쓰일 수 있도록 기반을 마련해 시각적으로 보여주는 데이터분석팀의 리더이자 데이터 엔지니어 하록을 만나 이야기를 나누어 보았습니다.


 

 

 

 

 

안녕하세요, 먼저 자기소개 부탁드립니다.

안녕하세요, 저는 IDQ실 데이터분석팀 리더 하록이라고 합니다.

 

현재 리딩하고 계신 데이터분석팀에 대한 소개를 부탁드립니다.

데이터분석팀은 데이터를 수집하고 분석하여 저희가 서비스하는 게임의 지표를 향상하는 것을 가장 큰 목적으로 하는 팀입니다. 데이터를 수집하는 단계부터 시작해서 분석할 수 있는 플랫폼 개발 및 운영과 그 데이터를 분석하는 일까지 데이터의 흐름에 따라 팀 업무를 진행하고 있습니다.

 

팀 내에 직무는 어떻게 구분되어 있고 각각 어떤 역할을 하고 있나요?

회사마다 직무를 구분하는 기준이나 표현이 다른 편인데 저희는 데이터 엔지니어와 데이터 분석가로 구분합니다. 데이터 엔지니어는 데이터를 수집하고 데이터가 흘러가는 파이프라인, 저장소(데이터 웨어하우스 또는 데이터 레이크), 분석 플랫폼을 설계 및 관리하고, 데이터 비주얼라이제이션을 하는 직무입니다. 데이터 분석가는 이름 그대로 데이터를 추출하여 목적에 맞게 데이터를 분석하는 업무를 진행하는 직무입니다. 데이터 분석을 통해 현 상황을 파악하여 해결 방안을 제안하고 개선 아이디어를 도출하기도 합니다.

 

데이터분석팀의 하루 업무는 어떤 방식으로 진행되나요?

저희 팀의 업무는 계획해서 진행하는 업무와 외부에서 요청을 바탕으로 진행하는 업무가 있습니다. 기본적으로 계획한 업무를 진행하며 수시로 요청 오는 업무는 업무량에 따라 팀원들에게 분배하여 진행하고 있습니다.

 

요청 오는 업무라는 것은 어떤 유형이며 업무 비중은 어느 정도인가요?

현재 라이브하고 있는 라인 프로젝트 3종(포코팡, 포코포코, 포코팡타운)의 이슈가 다양하다 보니 그만큼 여러 요청이 오는 편입니다. 글로벌 개발실에서 개발 중인 신작들은 요청에 의한 업무라기보다 저희가 게임 런칭 전 선행해야 하는 작업이 더 많은 것 같습니다. 어떤 데이터를 남길 것인지, 그리고 그것이 의도한 대로 잘 남고 있는지를 확인하고 쉽게 확인할 수 있게 지표화하는 작업을 런칭 전에 최대한 갖춰놓는 것을 목표하기 때문에 그 작업이 많은 편입니다.

 

데이터 수집부터 분석과 활용까지 어떠한 흐름으로 업무가 진행되나요?

데이터를 수집하는 단계에서는 당장 활용하지 않더라도 최대한 많은 정보를 남기고자 개발팀과 협업합니다. 개발팀도 그 이유에 대해 잘 이해하고 계셔서 개발 시 적극적으로 반영해주고 계십니다. 그렇게 지금 당장 사용하지 않더라도 다양한 데이터를 쌓아 놓아야 나중에 어떤 니즈가 생겼을 때 활용이 가능하기 때문입니다. 니즈가 생긴 이후부터 데이터를 쌓기 시작하면 분석할 만한 데이터가 생기기까지 시간이 필요하니까 사전에 최대한 많은 데이터를 남겨두는 것이 중요합니다. 이렇게 수집한 데이터를 상시 쉽게 확인할 수 있도록 비주얼라이제이션으로 자동화 작업을 하고, 개발팀의 요청에 따라 수시 데이터를 추출하여 분석하는 작업을 진행합니다.

 

빅데이터라 불리는 시대에서 방대한 데이터의 수집에 기준점은 어떻게 잡으시나요?

기본적으로 ‘행동’을 기준으로 합니다. 저희는 게임 데이터가 기반이기에 당연히 그 대상은 유저가 됩니다. 유저가 게임을 켜는 순간부터 시작하여 데이터가 로딩되는 시간, 무언가 액션을 취하는 하나하나를 최대한 데이터로 남기려고 합니다. 게임을 시작한 순간부터 게임에서 벌어지고 있는, 눈에 보이는 것들은 최대한 데이터로 남겨진다고 생각하시면 됩니다.

다만 현실적으로 너무 방대한 데이터를 수집할 경우 유저가 보내야 하는 데이터 양 또한 많아지기에 그 사이에서 타협점을 잡으려고 합니다. 예를 들어 포코포코에서 퍼즐 블록을 하나 옮길 때마다 데이터를 쌓는다면 너무 방대한 데이터가 되기에 그런 부분은 포기할 수밖에 없는 것이죠.

 

우리 회사에서는 어떠한 데이터 파이프라인 구축되어 있나요?

데이터 파이프라인이라는 것이 이름 그대로 데이터가 흘러가는 일련의 아키텍처를 설계하는 것인데요, 어딘가에 데이터가 쌓여 있고 분석하는 툴에서 쓴다고 했을 때 단순히 복사해서 올 것인지, 실시간으로 보내줄 것인지 등 중간 과정을 어떻게 할 것인지를 설계하는 작업을 포함합니다. 수많은 데이터를 우리가 분석하는 시스템에서 어떻게 활용할지 니즈에 따라서 설계를 진행하는 것입니다. 실시간으로 분석할 것인지 하루에 한 번 분석할 것인지 분석 주기에 맞는 데이터를 보내주는 방식이 필요합니다. 예를 들어, 하루에 한 번씩 분석한다면 전날 데이터를 모아서 한 번에 보내주어도 되는데 이 경우 1분에 한 번씩 수시로 보내줄 필요는 없잖아요. 이렇게 가장 최적의 효율적인 방법을 찾아서 데이터를 보내주고 관리하는 것이 일반적인 데이터 파이프라인이라고 보시면 됩니다.

 

앞서 자동화에 대한 말씀을 주셨는데요, 어떤 부분이 자동화되어 있는 건가요?

기본적으로 NRU(New Registered User), DAU(Daily Active Users)와 매출 등 게임은 다르더라도 필수적으로 확인이 필요한 지표와 게임별로 필요한 지표나 통계를 지정한 주기에 맞추어 데이터를 추출하고 비주얼라이제이션 툴에서 확인 가능하도록 하는 일련의 과정을 자동화하였다고 보시면 됩니다. 자동화의 기본 틀을 데이터 엔지니어가 잡아 놓으면 이후에는 저희 팀 누구나 쉽게 접근해 작업하고 있습니다.

 

수집한 데이터는 어떻게 관리하고 계신가요?

AWS의 S3라는 서비스를 이용하고 있고, 데이터 삭제 없이 영구 보관을 목표로 관리하고 있습니다.

 

구글과 애플의 정책 변경 등 수시로 변하는 플랫폼 정책에 어떻게 대응하나요?

최근 대외적으로 발표되고 있는 플랫폼 정책에서의 데이터 수집 제약이 생기는 것은 대부분 기기 자체에 대한 정보를 수집하는 부분으로 알고 있습니다. 과거에는 동의받지 않은 상태에서 기기의 정보를 수집하여 사용자를 특정하고 그에 맞추어 광고하는 경우가 많은데요, 그 때문에 가장 영향을 받은 것은 광고 쪽이 아닐까 싶습니다. 저희 게임 자체가 기본적으로 동의받은, 가입과 로그인이 되어있는 상태에서 서비스를 진행하기에 타격을 받거나 이슈가 생긴 상황은 없습니다.

 

데이터분석팀 업무를 위해 여러 부서와 협업을 하실 텐데 어떤 식으로 협업이 이루어지나요?

데이터가 궁금한 개발 부서에서의 다양한 요청이 수시로 옵니다. 구체적으로 요청하는 분들도 계시고, 자세한 설명 없이 요청하시는 분들도 계시는데요, 입장을 바꿔봐도 설명하기 어려울 때가 있겠구나 하고 이해하려 합니다. 궁금해하시는 데이터에 대한 이야기를 듣고 최대한 그에 맞추어 데이터를 추출하여 분석해드리고 있습니다.

 

보통 어떤 데이터를 가장 궁금해하시나요?

물론 게임에 따라서 다르기는 한데 라이브 중인 게임이라면 계속 새로운 업데이트를 진행하기에 그때마다 새롭게 출시된 기능이 의도한 대로 동장하고 있는지를 확인하기 위해 데이터들이 어떻게 나오고 있는지를 궁금해하시는 경우가 많은 편입니다.

 

 


 

 

하록은 어떻게 데이터 엔지니어 직무를 선택하게 되셨나요?

저는 웹 개발자로 커리어를 시작했습니다. 서비스 쪽에서 개발 업무를 하다가 어느 날 데이터 분석을 하는 팀에서 서비스와 관련한 많은 데이터를 쌓아 놨는데 이걸 눈으로 쉽게 확인하고 싶으니 개발해달라는 요청을 받게 되었죠. 그때 제가 자원하여 작업을 하게 되었는데 작업을 한 김에 데이터도 직접 한번 뽑아보고 분석해보라고 하셔서 자연스럽게 데이터 관련 업무로 전환이 되었습니다. 막상 해보니 재미도 있었고요.

 

그래도 직무가 전환된 것인데 어려움은 없으셨나요?

개발자라고 하면 웹 개발자, 모바일 게임개발자, 온라인 게임개발자 등과 같이 특정한 전문성은 당연히 가져야겠지만 저는 그 선을 너무 그어 놓으면 안 된다고 생각하고 있습니다. 그래서 새로운 분야를 해볼 수 있다는 것 자체가 좋았고 막상 해보니 잘 맞고 재밌기도 해서 현재까지도 꾸준히 데이터 분야에서 개발하고 있습니다.

 

트리노드에는 어떻게 함께하게 되셨나요?

트리노드가 시작할 때부터 소식을 알고 있기도 했고, 같이 해보면 좋겠다고 생각하고 있었습니다. 아무래도 부산 출신이다 보니 다시 부산에 오고 싶다는 바람이 컸기 때문에 데이터 분석 직무가 없었음에도 게임 서버 개발자로 직무를 바꿔서라도 합류하려고 했었습니다. 그때가 제가 데이터 업무로 직무를 바꾼지 1~2년 되었을 초기였는데요, 당시 재직 중이던 회사의 팀장님께서 데이터 업무에 대해 좀 더 전문성을 쌓아보라고 말리셔서 그 바람을 접게 되었었죠. 그 이후에 트리노드에서도 데이터 분석에 대해 니즈가 생겼고 그때 기회다 싶어 지원하여 합류하게 되었습니다.

 

어떻게 보면 그때 팀장님이 계셨기에 데이터 전문가로 성장하는 데 도움이 되었겠어요.

그래서 사실 그 팀장님을 굉장히 고맙게 생각하고 있습니다.

 

그러면 부산을 떠났다가 다시 돌아오게 만드는 부산의 매력은 어떤 것일까요?

제가 부산 사람이라 부산의 매력이라고 하면 가장 큰 것은 친숙한 느낌이자 익숙한 공간이라는 것이고 오히려 서울에서 느꼈던 단점 때문에 더 돌아오고 싶었습니다. 솔직하게는 서울에서는 같은 돈을 벌어도 부산보다 더 행복해지기는 어려운 환경이라는 생각이 들었습니다. 그 당시 출퇴근을 2호선 라인으로 하였는데 출퇴근 자체가 번잡하고 힘들고, 물가도 비싸고 장기적으로 있을수록 힘들겠다고 생각했습니다. 그래서 기회가 있다면 다시 부산으로 돌아가고 싶다고 계속 생각했죠.

 

부산에서 가장 좋아하는 장소는 어디인가요?

가끔 취미 삼아 사진을 찍으러 돌아다니는데 남포동 근처 부산 민주공원에서 초량 방향으로 산복도로를 따라 걸으면 영도가 내려다보이는 경치도 좋고, 골목골목 예쁜 곳이 많아서 좋아하는 장소입니다.

 

데이터 엔지니어 업무를 하시며 가장 보람 있었던 것은 어떤 것인가요?

업무에 대해 일희일비하지 않는 편이지만 트리노드에 입사하여 데이터분석이라는 것을 할 수 있는 환경 자체를 만들었다는 것이 가장 보람 있지 않았나 생각합니다.

 

 

                                          하록이 찍은 부산의 아름다운 순간들

 

 

데이터분석팀만의 문화나 장점에 대한 소개 부탁드립니다.

아무래도 팀이 만들어지고 난 이후로 계속해서 성장 동력을 스스로 불어넣어야 하는 팀이다 보니 개인이 성장할 수 있도록 스터디나 세미나를 진행하고 있습니다. 재택 동안에는 잠시 멈췄었지만, 다시 준비해보려 합니다. 또한, 최대한 개인의 의견을 존중하여 주도적으로 업무 할 수 있는 환경을 만들려 노력 중입니다. 개인이 집중할 수 있는 시간을 보장하려 하고, 스스로 하고 싶은 업무가 있는 경우 업무 방향에서 크게 벗어나지 않는다면 최대한 수용해드리고 있습니다.

 

데이터 시대라 불리며 이 분야에 대한 관심도 상당한데요, 신입으로 지원하고 싶으신 분들은 어떤 것을 공부해야 좋을까요?

기본적으로 필요한 통계적 지식이나 개발 지식은 다들 어느 정도 갖추고 지원하고 계십니다. 다만, 아쉽다고 생각하는 부분은 커리큘럼에 따라 지식을 습득하는 데서 그치고 이를 활용해 사소한 것이라도 활용해보는 분이 잘 없다는 것이었습니다. 저희가 자동차 수리처럼 지식이 있어도 개인이 시도할 수 있는 게 어려운 분야라면 모르겠지만, 분석이나 개발의 영역에서는 개인이 시도해 볼 수 있는 것이 많다고 생각하거든요.

저는 야구를 좋아하는데 스토브리그 기간이 되면 제가 원하는 기사가 새로 등록될 때 알림 오게 하고, 연말 정산 때 예상 세액 계산을 편하게 하기 위해서 월급명세서만 특정 폴더에 넣어두면 알아서 계산되도록 프로그램을 만들어 뒀습니다. 분석가라면 코로나19가 2년째 유행하고 있는데 지금까지 공개된 다양한 데이터를 가지고 기존의 패턴을 분석한다거나 새롭게 앞으로의 양상을 예측해 볼 수도 있지 않을까요? 예전에 흥미롭게 보았던 것이 지하철에서 내가 어디에 서 있으면 자리에 앉을 확률이 올라갈까를 분석하신 분이 계셨어요.

이처럼 일상에서 커리큘럼 외적으로 자신의 지식과 호기심을 활용해 다양한 시도를 해보셨으면 좋겠습니다.

 

마지막으로 인사 부탁드립니다.

빅데이터 시대라고 하지만 실제로 빅데이터를 다룰 수 있는 곳과 기회는 많지 않다고 생각합니다. 트리노드에서는 몇백만의 유저를 바탕으로 신입부터 게임의 빅데이터를 충분히 경험할 수 있고 그것을 바탕으로 계속 성장하고 있는 팀이기에 좋은 분들과 계속 함께하고 싶습니다.

 

목록
scroll bottom scroll top
POKOPANG is only available in Japan. POKOPANG TOWN is only available in Japan. Popup Close