1. 구글 파일 시스템(Google File System, GFS) - 구글 파일 시스템은 구글의 대규모 클러스터 서비스 플랫폼의 기반이 되는 파일 시스템으로 개발 가. GFS의 가정 - 저가형 서버로 구성된 환경으로 서버의 고장이 빈번히 발생할 수 있다 가정 - 대부분의 파일은 대용량이라 가정하며 효과적으로 관리할 수 있는 방법 요구 - 작업 부하는 연속적으로 많은 데이터를 읽는 연산이나 임의의 영역에서 적은 데이터를 읽는 연산 - 파일 쓰기는 순차적으로 데이터를 추가하며 파일에 대한 갱신은 드물에 이루어짐 - 동시에 파일을 추가하는 환경에서 동기화 오버헤드를 최소화할 방법 요구 - 낮은 응답 지연시간보다 높은 처리율이 중요 나. GFS의 구성 - GFS는 아래와 같이 클라이언트, 마스터, Chunk ..
해당 포스팅은 데이터 분석 전문가(ADP)와 데이터 분석 준전문가(ADsP)와 공통 과목인 3과목 데이터 분석 기획 제 1장 데이터 분석 기획의 이해 제 4절 분석 프로젝트 관리 방안에 관련된 내용 입니다. 분석과제 관리를 위한 5가지 주요 영역 분석과제는 일반적인 다른 프로젝트의 관리의 10가지 영역별(통합, 이해관계자, 의사소통 리스크 등) 관리가 수행되어야 할 뿐 아니라 데이터에 기반한 분석기법을 적용하는 특성으로 인해 5가지 주요 속성을 고려한 추가적인 관리가 필요하다 Data Size (데이터 양) - 분석하고자 하는 데이터 양을 고려한 관리 방안 수립 필요- 기존 RDBMS에서 관리하는 데이터 양과 하둡(Hadoop) 등에서 관리하는 엄청난 양의 빅데이터는 필연적으로 관리 방식에서 차이가 날 ..