[도서리뷰] 빅데이터 커리어 가이드북

    처음 이 책을 볼 때에는 그저그런 전문가 분이 집필한 어설픈 가이드북이 아닌가? 라는 생각을 가졌던 것 같습니다. 그러나 이 생각은 책을 펼친지 얼마 되지 않아 그런 생각은 고스란히 사라지고 말았습니다.

     

    아마도 빅데이터 혹은 유사한 직무를 하는 분들은 자신의 직업이 명확히 무엇인지 모르는 분들이 많을 것입니다. 심지어 내가 하는 업무에 대한 명확한 정의를 내지 못하는 사람들이 꽤 많습니다. 이는 유사하면서도 미세하게 나뉠 수 있는 스킬과 업무의 특성 때문인데 년차가 얼마 되지 않을 경우 더더욱 본인의 직업을 정의 내리기 힘들어 합니다.

     

    빅데이터 커리어 가이드북


    제가 이 책을 보기전에 회사 동료들 중 년차가 낮은 동료들에게 이렇게 물어본적이 있습니다.


    “연구원님은 본인의 직업을 디테일하게 정확히 무엇이다 정의 내릴 수 있나요?”

     

    사실 제가 근무하는 팀은 데이터 전문가 뿐만 아니라 딥러닝 모델링도 하고, 전처리 담당도 하는 등 다양한 업무를 하는 사람들이 많았기에 자신의 직업을 명확히 정의하지 못하고 두루뭉실하게 인공지능 전문가 혹은 빅데이터 전문가로 퉁 치는 경우가 많았기 때문입니다.

    그럼 이 책은 “내가 하는 업무의 직업명을 알려주는 건가”라는 단순한 생각을 할지도 모르겠습니다. 이 책은 책의 제목인 “커리어 가이드북”인 것처럼 현재 내가 하는 업무에 대한 정의 뿐만 아니라 부족한 지식도 알려주고 있으며, 앞으로 가야 할 넥스트 직업에 대한 방향성까지 제시를 해줍니다. 그러다보니 이 책은 상당히 많은 내용들을 담고 있고, 내용을 이해하는데 매우 쉽습니다.

     


     

    책의 구성

    이 책은 크게 4가지의 구성을 가지고 있습니다. 첫번째 빅데이터 세상 파트는그동안 빅데이터는 어떻게 발전해 왔고, 앞으로 어떻게 변화할 것이며 현재 빅데이터 기술에 대해서 거시적인 관점으로 내용을 적고 장밋빛 미래를 제시하고 있습니다.

     

    책의 4가지 파트

     

    빅데이터의 탄생 과정부터 지금에 이르기까지 과정을 지켜봐온 저로서는 매우 잘 알고 있는 내용이지만, 빅데이터에 대한 용어의 정의부터 그동안 어떤 프로젝트가 있었으며, 빅데이터가 왜 중요한지 이해를 못하는 지금 취준생에게 간단하면서도 핵심적으로 짚어주는 파트입니다.

     

    그렇게 빅데이터에 대해서 이해를 하고, 앞으로 방향에 대해서 알게 되었다면 두번째 파트인 빅데이터 직무에서는 빅데이터 관련 직업들을 분류하고 정의하며 현업 전문가들의 인터뷰 및 취업준비생에게 가이드를 제시해 줍니다. 이는 제가 위에서 팀 동료들에게 말한 "당신 직업을 디테일하게 정의내려보라"라는 것과 비슷한 것인데요. 이 파트를 읽게 된다면 현업자는 자신의 직업명을 명확히 말을 할 수 있고, 취준생분들은 앞으로 어떤 직업을 하고 싶은지 가야할 길을 명확히 이해할 수 있는 것이죠.

    세번째 파트인 빅데이터 지식은 빅데이터를 공부해야 하는 방법, 사이트, 도구(Tool), 언어(ex: python, java), 라이브러리(ex: Matplotlib), 프레임워크(ex: Scikit-learn, Tensorflow) 필요한 수학적인 지식등을 알려줍니다. 보통 도서에는 사이트 정보까지 알려주는 경우가 흔치 않은데 이 책에서 알려주는 지식은 회사의 사수 혹은 멘토가 부사수 및 멘티에게 알려주듯이 A to Z 형태로 자세히 알려주고 있습니다. 

    마지막 네번째 파트인 빅데이터 취업의 경우 어떻게 스펙(Spec)을 쌓아야 하는지 어떤 회사를 다녀야 하는지 등을 친절하고 자세하게 알려준다는 점입니다. 공부를 다 한 사람들은 그 다음 어떻게 스펙을 쌓아야 할지 선배나 알려줄 사람이 없을 경우 답답할 수 있는데요. 이 책의 마지막 장으로 그런 부분을 말끔히 해소시켜 줍니다.

    도서의 대상

    결국 이 도서의 핵심 대상은 빅데이터 관련 직업으로 꿈을 꾸는 학생들 혹은 빅데이터로 전직을 원하는 개발자나 기획자와 같은 경력자들입니다. 하지만 저는 오히려 이 책을 보면서 다른 관점으로 생각을 하게 되었습니다. 우선 팀을 꾸리고 있는 입장으로 주먹구구식의 운영이 아니라, 보다 해야할 일을 직업별로 응집하여 멤버들에게 업무를 부여하고 앞으로 트렌드에 대해서도 이해하게 된 케이스 인 것 같습니다.

    그리고 빅데이터 팀과 자주 작업을 하는 현업자 분들 혹은 기획자, PM 분들은 한번 정도 읽으면 정말 유익한 책이라 생각합니다. 그래야 빅데이터 현업자들이 어떤 고민을 하고 있고 어떻게 문제를 처리하는지 이해를 할 수 있기 때문입니다. 

     

    제가 근무하는 팀을 전담하는 인프라 연구원의 경우 저희 때문에 파이썬 뿐만 아니라 딥러닝과 머신러닝을 별도로 공부하신분이 있는데요. 그래서 프로그램 설치 요청을 하게 될 경우 정말 알아서 저희의 참여 없이 프로그램을 깔끔히 처리해 주시고, MongoDB를 Replicaset으로 운영하게 되었을 때 에러가 발생하면 원인을 파악하여 알려주기까지 할 정도로 인프라 연구원 분이 어느새 빅데이터 엔지니어, 머신러닝 엔지니어의 업무를 도와주고 있는 것을 보면서 내가 관계된 업무에 대해서 공부를 하는 것이 얼마나 중요한지 깨달을 수 있었던 것 같습니다.

     

    물론 작은 회사의 경우 한두사람이 위와 같은 업무를 모두 전담하는 경우가 대다수겠지만, 위 인프라 연구원분이 공부를 한 것처럼 빅데이터에 조금이라도 관여가 되어 있고 업무를 이해하고 싶다면 정말 좋은 도서라 생각합니다. 이렇게 저희 회사처럼 업무가 철저히 분담이 되어 있는 곳이라면, 팀별로 한권 정도 구매해 놓으면 좋을 것 같습니다.

     

    도서의 장점

    책은 약 400페이지 정도로 빅데이터 관련 도서의 경우 시간이 꽤 걸릴 수 있으나, 이 책의 경우 최대한 어려운 말들은 배제하여 1시간당 꽤 많은 페이지를 읽을 수 있습니다. 물론 제가 현업자이기 때문에 내용을 쉽게 이해할 수 있어서 그럴지도 모르지만 어려운 용어를 최소화 하여 내용이 쉽고, 자세하게 가이드를 해주기 때문이기에 좀 더 읽기 수월합니다.

    그리고 이 책의 저자는 국내에서 손꼽히는 데이터마이닝 전문가입니다. 교재에서는 No.1 데이터마이닝 전문가로 나와있지만, 사실 이건 전국의 모든 데이터마이닝 전문가가 모여서 서열을 나눈 것이 아니니 No.1이라는 말에는 동의하기 힘들지만 직함으로 봤을 땐 우리나라에서 3손가락 안에 드는 전문가라는 것은 확실한 것 같습니다.

     

    조성준 저자 분의 경력

     

    사실 국내 인공지능 및 빅데이터는 미국에 비해 2년 가까이 뒤쳐졌기 때문에 대부분 해외의 전문가 및 빅 테크 기업들이 어떻게 하는 것을 주시하는 경향이 있으며, 이 저자분은 교수와 센터장에 가깝다고 하지만 숨은 고수분들 중 상당수가 큰 기업에 CTO로 재직하거나, 이미 미국 빅테크 기업에서 한자리 하시는 분들이 꽤 되기 때문입니다.

     

    저는 개인적으로 저자분의 얘기보다 이 책의 구성이 매우 좋고 가장 큰 강점은 현업자들의 인터뷰 였던 것 같습니다. 아무리 훌륭한 분이라도 모든 프로젝트를 다 경험해 본적이 없습니다. 특히, 데이터마이닝과 같은 경우 하나의 프로젝트에 정말 많은 시간을 할애해야 하기 때문에 내가 경험해보지 못한 사고와 문제점이 분명 있습니다.

     

    이 글을 쓰고 있는 저 역시도 텍스트 마이닝만 2009년부터 시작하여 데이터 분석 프로젝트들을 합치면 100개가 넘겼으며 십몇년간 청사, 대기업, 은행 그리고 대학교에서 근무를 하였습니다. 하지만 매번 새로운 프로젝트와 새로운 시도를 해야 했으며 인공지능이 본격화되는 2015년이 넘어가는 순간부터는 스킬까지도 새로운 것을 시도했던 것 같습니다.

     

    즉, 매번 다른 프로젝트를 한다는 것은 내가 아직 경험해보지 못한 프로젝트가 무궁무진하게 쌓여있다는 뜻이고, 또 그만큼 시행착오를 해야 한다는 것이며 과거의 생각이 지금은 틀릴 수도 있습니다. 이런 내 생각을 보충하기 위해서는 권위가 있거나 경력이 풍부하고 성과를 이룬 경력자들과 다양한 토론과 의견을 듣는 것이 제일 중요할텐데요.

     

    경력자들의 인터뷰

     

    이 책은 직무별로 경력자들의 인터뷰를 하는 방식이 들어있어서 매우 유익하고, 취준생뿐만 아니라 경력자가 보기에도 충분히 의미있는 내용을 담고 있다 생각합니다. 저는 빅데이터와 같이 데이터에 관련된 업무에서 가장 중요한 것은 창조적인 생각이 가장 중요하다고 생각하는데요. 내가 겪지 못한 부족한 생각을 창조적인 생각을 가진 다른 이의 인터뷰를 들으면서 채우는 것은 매우 중요한 내용이라 생각합니다.

    게다가 신입이라면 인터뷰를 잘 하는게 중요할텐데 유연한 사고를 가지지 못한다면 현업자들의 질문 공세에 어버버하다가 탈락하는 경우가 많기 때문입니다. 그러니 간접적인 경험을 가지고 그 인터뷰의 내용을 숙지를 해주는 도서가 있다는 것에서 정말 훌륭한 가이드 북이라 생각합니다.

     

    해당 도서는 길벗 출판사에게 도서를 증정받아 리뷰를 작성한 포스팅이며,
    도서 이외에 어떤 금품을 지급 받은 적이 없는 순수한 리뷰입니다.

     

    댓글

    Designed by JB FACTORY