분석 프로젝트 관리 방안, ADP/ADsP #22

    해당 포스팅은 데이터 분석 전문가(ADP)와 데이터 분석 준전문가(ADsP)와 공통 과목인 3과목 데이터 분석 기획 제 1장 데이터 분석 기획의 이해 제 4절 분석 프로젝트 관리 방안에 관련된 내용 입니다. 



    분석과제 관리를 위한 5가지 주요 영역


    분석과제는 일반적인 다른 프로젝트의 관리의 10가지 영역별(통합, 이해관계자, 의사소통 리스크 등) 관리가 수행되어야 할 뿐 아니라 데이터에 기반한 분석기법을 적용하는 특성으로 인해 5가지 주요 속성을 고려한 추가적인 관리가 필요하다



    Data Size (데이터 양)

    - 분석하고자 하는 데이터 양을 고려한 관리 방안 수립 필요

    - 기존 RDBMS에서 관리하는 데이터 양과 하둡(Hadoop) 등에서 관리하는 엄청난 양의 빅데이터는 필연적으로 관리 방식에서 차이가 날 수 밖에 없음


    Data Complexity (데이터 복잡성)

    - 텍스트, 오디오, 비디오 등의 비정형 데이터 및 다양한 시스템에 산재되어 있는 데이터들을 통합해서 분석

    - 다양한 데이터들이 잘 적용될 수 있는 분석 모델의 선정을 사전에 고려


    Speed (속도)

    - 분석결과가 도출되었을 때 시나리오 측면에서 속도를 고려

    - 분석 모델의 성능 및 속도를 고려한 개발 및 테스트가 수행되어야 함(ex: Hadoop은 실시간 처리를 위한 빅데이터 솔루션이 아님. 실시간 처리를 위해서는 In-Memory 기반의 Spark와 같은 빅데이터 솔루션을 도입해야 하는 것을 고려해야 함)


    Analytic Complexity (분석 복잡성)

    - 분석 모델의 정확도와 복잡도는 트레이드 오프(Trade-Off) 관계가 존재

    - 분석 모델이 복잡할수록 정확도가 향상되나 사용자에게 설명을 할 수 없는 문제 발생

    - 해석이 가능하면서 정확도를 올릴 수 있는 최적 모델을 찾는 방안을 사전에 모색



    Accuracy & Precision (정확도, 정밀도)

    - Accuracy(정확도)는 모델과 실제 값 사이의 차이가 적다는 것을 의미하고, Precision(정밀도)은 모델을 지속적으로 반복했을 때 편차의 수준이 작은 것을 의미

    - 안정성 측면에서는 Precision을 분석의 활용 측면에서는 Accuracy가 중요





    분석 프로젝트의 특성


    - 분석가는 데이터를 다루는 데이터 영역과 결과를 활용할 비즈니스 영역의 중간에서 분석 모델을 통한 조율을 수행하는 조정자의 역할도 수행

    - 조정자로서의 분석가는 대부분 관리자까지 겸임하기에 프로젝트 관리방안 이해와 주요 관리 포인트를 사전에 숙지하는 것이 필요

    - 분석 프로젝트는 결과를 한번 내는 것에서 끝나는 것이 아닌, 지속적인 반복과 정교화가 수행되는 작업이 대부분이기에 프로토타이핑 방식의 애자일(Agile)에 대한 고려 필요



    분석 프로젝트의 관리 방안


    주제 그룹

    개념 및 관련 프로세스

    통합

    (Integration)

    - 프로젝트 관리 프로세스들이 통합적으로 운영될 수 있도록 관리

    이해관계자

    (Stakeholder)

    - 프로젝트 스폰서, 고객사, 기타 이해관계자를 식별하고 관리 필요

    범위

    (Scope)

    - 데이터 형태, 데이터 양, 모델의 알고리즘에 따라 범위가 빈번하게 변경

    - 최종 결과물의 모습(분석 보고서, 시스템)에 따라 자원 및 범위가 크게 변경

    자원

    (Resource)

    - 고급 분석 및 아키텍처를 수행할 인력 공급이 부족하기에 사전 검토

    시간

    (Time)

    - 분석 프로젝트는 의도한 결과가 잘 나오지 않기에 많은 시간 소요 가능

    - 품질이 보장된다는 전제로 Time Boxing 기법으로 일정관리 진행 필요

    원가

    (Cost)

    - 외부 데이터가 필요한 경우 고가의 비용 소모 가능성 존재

    - 오픈소스(Tool)외에 의도했던 결과를 달성하기 위해 상용 도구가 필요할 수 있음

    리스크

    (Risk)

    - 데이터 미확보 등 관련 위험을 식별하고 대응방안을 사전에 수립

    - 데이터 및 알고리즘 한계로 목표 달성이 어려울 수 있음

    품질

    (Quality)

    - 분석 프로젝트의 수행 결과에 대한 품질 목표 사전 수립 및 확정

    - 품질 통제(Quality Control)와 품질 보증(Quality Assurance)로 나뉘어 수행

    조달

    (Procurement)

    - 프로젝트 목적에 맞는 외부 소싱을 적절하게 운영할 필요 존재

    - PoC(Proof of Concept) 형태의 프로젝트는 클라우드 검토 필요

    의사소통

    (Communication)

    - 데이터 분석 결과를 모든 이해관계자와 공유 필요

    - 프로젝트의 원활한 진행 위해 다양한 의사소통체계 마련 필요


    - 기본적으로 데이터 프로젝트의 영역별 주요 관리 항목들은 일반적인 개발 프로젝트에 사용되는 프로젝트의 관리 영역과 동일

    - Time Boxing 기법은 반복형 개발에 쓰이는 프로젝트 관리 기법으로 작업을 완수하지 못할 경우 다음 과정으로 넘기는 것을 의미한다



    댓글

    Designed by JB FACTORY