요즘 조상을 찾는 서비스가 전세계 트렌드로 대표적으로 23andMe와 같은 서비스가 있다. 국내에서는 해당 서비스를 사용할 수 없기 때문에 아직까지 한국인들의 해당 서비스를 보는 것은 해외에 거주중인 유학생 혹은 재미교포들이 올린 내용들을 보면서 어느정도 내 조상은 이럴 것이다 유추하는 것이었는데 이와 유사한 서비스가 국내에서 런칭이 되었다. 바로 유후(YouWho)라는 서비스로 필자가 처음 패키지를 신청했던 날짜가 4월 중순 정도였고 총 약 2주 정도의 시간이 걸렸다. 제품 결제 및 키트 수령 당연하겠지만, 우선 Youwho.co 사이트에서 제품을 결제해야 한다. 참고로 필자는 가격이 3만원일 때 신청 했는데, 아무래도 점점 시간이 지날수록 판매가격이 오르는 것 같다. 5월 5일에 가정의달 서비스로 엄..
해당 포스팅은 데이터 분석 전문가(ADP)와 데이터 분석 준전문가(ADsP)와 공통 과목인 3과목 데이터 분석 기획 제 1장 데이터 분석 기획의 이해 제 4절 분석 프로젝트 관리 방안에 관련된 내용 입니다. 분석과제 관리를 위한 5가지 주요 영역 분석과제는 일반적인 다른 프로젝트의 관리의 10가지 영역별(통합, 이해관계자, 의사소통 리스크 등) 관리가 수행되어야 할 뿐 아니라 데이터에 기반한 분석기법을 적용하는 특성으로 인해 5가지 주요 속성을 고려한 추가적인 관리가 필요하다 Data Size (데이터 양) - 분석하고자 하는 데이터 양을 고려한 관리 방안 수립 필요- 기존 RDBMS에서 관리하는 데이터 양과 하둡(Hadoop) 등에서 관리하는 엄청난 양의 빅데이터는 필연적으로 관리 방식에서 차이가 날 ..
분석 과제를 본격적으로 정의하기 위해서 '분석과제 정의서'를 작성하여 분석별로 필요한 소스 데이터, 분석 방법, 데이터 입수 난이도, 데이터 입수 사유, 분석 수행주기, 분석결과에 대한 검증 Owner, 분석 과정 상세 등을 작성한다. 분석 과제 정의서는 향후 프로젝트 수행 계획의 입력물로 사용되며 수행하는 이해관계자가 프로젝트의 방향을 설정하고, 성공 여부를 판별 할 수 있는 중요한 자료로서 명확하게 작성해야 한다. 분석과제 정의서 샘플 분석명 분석정의 해지 상담 접촉패턴 분석 기 해지 계약건 발생 고객의 해지 시점 상담정보 분석을 통해 해지 고객의 상담 특성을 발굴하는 분석 소스데이터 데이터 입수 난이도 분석방법 접촉채널, 검수, 접촉평균 시간 최종 접촉 이후 해지까지 시간 상담인력 업무 능숙도 서비..
상향식 접근 방법(Bottom Up Approach)는 하향식 접근 방법(Top Down Approach)의 주제를 잡고 문제를 해결해 나가는 방식과 반대로 데이터를 기반으로 문제를 찾아내는 방식을 말한다. 하향식이 주로 지도 학습(Supervised Learning) 기반의 알고리즘을 이용한다면, 상향식은 문제를 찾아내기 때문에 비지도 학습(Unsupervised Learning)을 주로 사용한다. 하향식 접근 방법의 한계 - 솔루션 도출에는 유효하지만 새로운 문제 탐색의 한계 - 논리적인 단계별 접근법 기반의 문제해결 방식은 복잡하고 다양한 환경에서 발생하는 문제에는 비적합 - 이를 해결하기 위해 스탠포드 대학의 d.school(Institute of Design at Stanford)은 디자인 사고..
바로 이전 강의에 최초의 암호화폐인 이캐시(eCash)에 대해서 알아 보았다. 인터넷 혁명이 일어난 후, 이캐시를 필두로 수많은 전자, 암호화폐들이 등장했다 사라졌다. 대다수는 비록 허무하게 사라지고 잊혀졌지만, 비트코인 백서에서 알 수 있듯이 수많은 암호화폐들이 비트코인을 만들게 해준 존재 사유가 되었다. 비트골드(bitgold)는 그 이름에서부터 유추가 되듯 비트코인에게 영향을 준 암호화폐라고 볼 수 있다. 비록 사토시 나카모토의 비트코인 백서에서는 비트골드에 대한 언급이 없지만, 명칭부터 시작해서 비트코인과 유사하며 사람들은 실질적으로 비트코인과 가장 유사한 아키텍처라고 말하고 있다. 참고로 비트코인골드(Bitcoin Gold, BTG)와는 완전히 다른 화폐이다. 비트골드는 암호화폐계에서 진정한 아..
R에는 다양한 포맷의 파일들을 매우 쉽게 가져오는 기능을 제공하고 있다. 파일의 입출력 실습은 붓꽃(IRIS) 데이터를 기반으로 진행해보도록 한다. 아이리스 데이터1,5.1,3.5,1.4,0.2,Iris-setosa 2,4.9,3,1.4,0.2,Iris-setosa 3,4.7,3.2,1.3,0.2,Iris-setosa 4,4.6,3.1,1.5,0.2,Iris-setosa 5,5,3.6,1.4,0.2,Iris-setosa 6,5.4,3.9,1.7,0.4,Iris-setosa 7,4.6,3.4,1.4,0.3,Iris-setosa 8,5,3.4,1.5,0.2,Iris-setosa 9,4.4,2.9,1.4,0.2,Iris-setosa 10,4.9,3.1,1.5,0.1,Iris-setosa 11,5.4,3.7,1..
이전 포스팅에서는 classification 모델을 MNIST 데이터를 이용하여 분류를 해보았다. 그러나 많은 사람들이 데이터가 약간만 변형이 되어도 즉 틀이 다른 데이터를 어떻게 학습해야 되는지 헷갈려 할수가 있다. 해당 포스팅은 대표적인 데이터셋인 붓꽃(IRIS) 데이터셋을 기반으로 신경망을 수행하고 학습하여 테스트셋 아이리스 값의 정확도를 측정한다. 참고로 해당 포스팅은 연속적인 지식의 습득을 위해 이전 포스팅의 신경망 소스와 크게 다르지 않다. 데이터 구조 아이리스 데이터 구조... 47,5.1,3.8,1.6,0.2,Iris-setosa 48,4.6,3.2,1.4,0.2,Iris-setosa 49,5.3,3.7,1.5,0.2,Iris-setosa 50,5,3.3,1.4,0.2,Iris-setosa..
하향식 접근 방법(Top Down Approach)는 현황 분석을 통해 인식된 문제점 혹은 전략으로부터 문제 탐색(Problem Discovery), 데이터 문제로 정의(Problem Difinition), 해결방안을 탐색(Solution Search), 데이터 분석의 타당성 평가(Feasibility Study)라는 단계를 거쳐 분석 과제를 도출하는 과정이다. 문제 탐색(Problem Discovery) - 전체적인 관점의 기준 모델을 활용하여 빠짐없이 문제를 도출 및 식별이 중요 - 기준 모델로 비즈니스 모델과 외부 참조 모델 존재 - 문제를 해결하여 발생하는 가치에 중점 비즈니스 모델 기반 문제 탐색 비즈니스 모델 캔버스의 9가지 블록을 단순화하여 업무, 제품, 고객,단위로 문제를 발굴하고, 이를 ..
분석과제 발굴 방법에는 크게 2가지인 하향식 접근 방법(Top Down Approach)과 상향식 접근 방법(Bottom Up Approach)으로 발굴을 할 수 있다. 하향식 접근 방법(Top Down Approach)는 문제가 주어지고 이에 대한 해법을 찾기 위해서 각 과정이 체계적으로 단계화되어 수행하는 방식이다. 반면 상향식 접근 방법(Bottom Up Approach)는 문제의 정의가 어려운 경우 데이터를 기반으로 문제의 재정의 및 해결방안을 탐색하고 이를 지속적으로 개선을 하는 방식이다. 이를 그림으로 표현하면 다음과 같다. 분석 과제 도출의 2가지 유형 하향식 접근 방법은 기존의 전통적인 접근 방법이다. 즉 문제를 이미 알고 있어서, 명확하게 오더가 내려지는 모양새라 생각하면 된다. 이를 회..
파이참(Pychamr) 테마(Theme) 변경 1. File -> Settings 선택 (Ctrl + Alt + S) 2. Appearance & Behavior -> Appearance 선택 -> Thema에서 원하는 테마 선택 후, Apply 파이참(Pycharm) 코드 폰트(Code font) 변경 1. File 메뉴 -> Setting을 선택(Ctrl + Alt + S) 2. Editor -> Font 선택 3. 우측에 있는 Font에서 원하는 폰트와 Size로 크기를 지정
MNIST(Modified National Institute of Standards and Technology database)는 0~9까지의 숫자를 사람들이 손으로 직접 쓴 손글씨를 이미지화한 데이터셋이다. 딥러닝(Deep Learning)을 제외한 머신러닝(Machine Learning)에 IRIS(붓꽃 데이터)셋이 있다면 딥러닝에는 MNIST가 있으며 그만큼 성능을 자랑하기에 매우 딥러닝에 효율적이며 기본으로 내장이 되어 있어서 언제든지 불러서 실습을 해볼 수가 있는 데이터셋이다. MNIST 데이터셋 최근에는 이에 MNIST보다 조금 더 분류가 힘든 fashion mnist라는 데이터셋이 신규로 추가되었다. 둘의 포맷은 완전히 동일하기에 성능을 측정하기에 MNIST보다 더 수월해보인다. Fashio..
샤오미 공기청정기(미에어 프로) 구입 후, 얼마 지나지 않아 필터를 교체 메세지가 떠서 아무 생각없이 11번가에서 호환이 되는 필터를 구입하여 교체를 하였었다. 그리고 사용한지 4~5개월 정도가 된 상태에서 또 필터를 교체하라는 문구가 뜨게 되었다. 처음에는 기간으로 인식하나 싶다가도 이번에 산 것은 내장 칩이 장착되지 않은 필터 제품이기에 필터의 흡수율도 어느정도 영향을 주는 것 같다. 한마디로 RFID가 있는 필터 공식 제품이면 기간에 영향을 추가로 주고, 없을 경우 필터율을 보는 것 같다. 집에 고양이가 2마리인데, 털이 많은 녀석은 시도때도 없이 공기청청기 위로 점프를 하며 전원이 꺼져있으면 지가 켜기도 한다;; 선선한 바람까지 나오니 아주 신선이 따로 없다. 아무튼 집에 고양이털이 너무 많이 휘..