바로 이전 강의에 최초의 암호화폐인 이캐시(eCash)에 대해서 알아 보았다. 인터넷 혁명이 일어난 후, 이캐시를 필두로 수많은 전자, 암호화폐들이 등장했다 사라졌다. 대다수는 비록 허무하게 사라지고 잊혀졌지만, 비트코인 백서에서 알 수 있듯이 수많은 암호화폐들이 비트코인을 만들게 해준 존재 사유가 되었다. 비트골드(bitgold)는 그 이름에서부터 유추가 되듯 비트코인에게 영향을 준 암호화폐라고 볼 수 있다. 비록 사토시 나카모토의 비트코인 백서에서는 비트골드에 대한 언급이 없지만, 명칭부터 시작해서 비트코인과 유사하며 사람들은 실질적으로 비트코인과 가장 유사한 아키텍처라고 말하고 있다. 참고로 비트코인골드(Bitcoin Gold, BTG)와는 완전히 다른 화폐이다. 비트골드는 암호화폐계에서 진정한 아..
R에는 다양한 포맷의 파일들을 매우 쉽게 가져오는 기능을 제공하고 있다. 파일의 입출력 실습은 붓꽃(IRIS) 데이터를 기반으로 진행해보도록 한다. 아이리스 데이터1,5.1,3.5,1.4,0.2,Iris-setosa 2,4.9,3,1.4,0.2,Iris-setosa 3,4.7,3.2,1.3,0.2,Iris-setosa 4,4.6,3.1,1.5,0.2,Iris-setosa 5,5,3.6,1.4,0.2,Iris-setosa 6,5.4,3.9,1.7,0.4,Iris-setosa 7,4.6,3.4,1.4,0.3,Iris-setosa 8,5,3.4,1.5,0.2,Iris-setosa 9,4.4,2.9,1.4,0.2,Iris-setosa 10,4.9,3.1,1.5,0.1,Iris-setosa 11,5.4,3.7,1..
이전 포스팅에서는 classification 모델을 MNIST 데이터를 이용하여 분류를 해보았다. 그러나 많은 사람들이 데이터가 약간만 변형이 되어도 즉 틀이 다른 데이터를 어떻게 학습해야 되는지 헷갈려 할수가 있다. 해당 포스팅은 대표적인 데이터셋인 붓꽃(IRIS) 데이터셋을 기반으로 신경망을 수행하고 학습하여 테스트셋 아이리스 값의 정확도를 측정한다. 참고로 해당 포스팅은 연속적인 지식의 습득을 위해 이전 포스팅의 신경망 소스와 크게 다르지 않다. 데이터 구조 아이리스 데이터 구조... 47,5.1,3.8,1.6,0.2,Iris-setosa 48,4.6,3.2,1.4,0.2,Iris-setosa 49,5.3,3.7,1.5,0.2,Iris-setosa 50,5,3.3,1.4,0.2,Iris-setosa..
하향식 접근 방법(Top Down Approach)는 현황 분석을 통해 인식된 문제점 혹은 전략으로부터 문제 탐색(Problem Discovery), 데이터 문제로 정의(Problem Difinition), 해결방안을 탐색(Solution Search), 데이터 분석의 타당성 평가(Feasibility Study)라는 단계를 거쳐 분석 과제를 도출하는 과정이다. 문제 탐색(Problem Discovery) - 전체적인 관점의 기준 모델을 활용하여 빠짐없이 문제를 도출 및 식별이 중요 - 기준 모델로 비즈니스 모델과 외부 참조 모델 존재 - 문제를 해결하여 발생하는 가치에 중점 비즈니스 모델 기반 문제 탐색 비즈니스 모델 캔버스의 9가지 블록을 단순화하여 업무, 제품, 고객,단위로 문제를 발굴하고, 이를 ..
분석과제 발굴 방법에는 크게 2가지인 하향식 접근 방법(Top Down Approach)과 상향식 접근 방법(Bottom Up Approach)으로 발굴을 할 수 있다. 하향식 접근 방법(Top Down Approach)는 문제가 주어지고 이에 대한 해법을 찾기 위해서 각 과정이 체계적으로 단계화되어 수행하는 방식이다. 반면 상향식 접근 방법(Bottom Up Approach)는 문제의 정의가 어려운 경우 데이터를 기반으로 문제의 재정의 및 해결방안을 탐색하고 이를 지속적으로 개선을 하는 방식이다. 이를 그림으로 표현하면 다음과 같다. 분석 과제 도출의 2가지 유형 하향식 접근 방법은 기존의 전통적인 접근 방법이다. 즉 문제를 이미 알고 있어서, 명확하게 오더가 내려지는 모양새라 생각하면 된다. 이를 회..
파이참(Pychamr) 테마(Theme) 변경 1. File -> Settings 선택 (Ctrl + Alt + S) 2. Appearance & Behavior -> Appearance 선택 -> Thema에서 원하는 테마 선택 후, Apply 파이참(Pycharm) 코드 폰트(Code font) 변경 1. File 메뉴 -> Setting을 선택(Ctrl + Alt + S) 2. Editor -> Font 선택 3. 우측에 있는 Font에서 원하는 폰트와 Size로 크기를 지정
MNIST(Modified National Institute of Standards and Technology database)는 0~9까지의 숫자를 사람들이 손으로 직접 쓴 손글씨를 이미지화한 데이터셋이다. 딥러닝(Deep Learning)을 제외한 머신러닝(Machine Learning)에 IRIS(붓꽃 데이터)셋이 있다면 딥러닝에는 MNIST가 있으며 그만큼 성능을 자랑하기에 매우 딥러닝에 효율적이며 기본으로 내장이 되어 있어서 언제든지 불러서 실습을 해볼 수가 있는 데이터셋이다. MNIST 데이터셋 최근에는 이에 MNIST보다 조금 더 분류가 힘든 fashion mnist라는 데이터셋이 신규로 추가되었다. 둘의 포맷은 완전히 동일하기에 성능을 측정하기에 MNIST보다 더 수월해보인다. Fashio..
샤오미 공기청정기(미에어 프로) 구입 후, 얼마 지나지 않아 필터를 교체 메세지가 떠서 아무 생각없이 11번가에서 호환이 되는 필터를 구입하여 교체를 하였었다. 그리고 사용한지 4~5개월 정도가 된 상태에서 또 필터를 교체하라는 문구가 뜨게 되었다. 처음에는 기간으로 인식하나 싶다가도 이번에 산 것은 내장 칩이 장착되지 않은 필터 제품이기에 필터의 흡수율도 어느정도 영향을 주는 것 같다. 한마디로 RFID가 있는 필터 공식 제품이면 기간에 영향을 추가로 주고, 없을 경우 필터율을 보는 것 같다. 집에 고양이가 2마리인데, 털이 많은 녀석은 시도때도 없이 공기청청기 위로 점프를 하며 전원이 꺼져있으면 지가 켜기도 한다;; 선선한 바람까지 나오니 아주 신선이 따로 없다. 아무튼 집에 고양이털이 너무 많이 휘..
암달의 법칙(Amdahl's law)은 미국의 컴퓨터 공학자이자 기업가였던 진 암달(Gene Amdahl)이 만든 법칙으로 암달의 저주(Amdahl's curse), 암달의 인수(Amdahl's argument)라고도 불린다. 진 암달(Gene Amdahl, 1922년 11월 16일 ~ 2015년 11월 10일)은 위스콘신 대학교 매디슨에서 이론물리학 석박사를 취득했고, 52년에 IBM으로 입사해 704 메인프레임, 시스템 360 메인프레임 등의 개발을 총괄하기도 했다. 암달의 법칙은 1965년 옮긴 어드밴스드컴퓨팅시스템랩에서 만든 것으로 컴퓨터 성능 최적화의 한계점을 측정하기 위해 만든 법칙이다. Gene Amdahl 암달의 법칙의 병렬 프로세스 성능 관점 암달의 법칙은 현재도 많이 쓰이며, 일반적으로..
키바나(Kibana) 키바나(Kibana)는 ELK(Elasticsearch, Logstash, Kibana)라는 엘라스틱서치 스택의 주요 솔루션 중 하나로 엘라스틱서치와 연계를 이루면서 비주얼라이징(Visualizing)을 통한 유저 인터페이스(User Interface, UI)를 제공하는 솔루션이다. 키바나를 설치하면 엘라스틱서치의 데이터를 쉽게 확인할 수 있고, 비주얼라이징을 통한 데이터 분석도 할 수 있으며, 관리기 역할까지 수행한다. (한마디로 필수적인 에드온이라 생각하면 된다) 설치하기 엘라스틱서치 다운로드 사이트에 키바나를 다운로드 할 수 있다. https://www.elastic.co/downloads/kibana 사이트로 이동하여, OS에 맡는 파일을 다운로드한다. (현재 이 포스팅을 쓰..
Divide & Conquer를 이용한 하향식, 구조적 방법론의 개요 구조적 방법론(Structured Development Methodology) 개념 - 전체 시스템을 기능에 따라 분할하여 개발하고, 이를 통합하는 분할과 정복(Divide & Conquer) 방식의 방법론, 프로세스 중심의 하향식 방법론(Top-Down) - 정형화된 분석 절차에 따라 사용자 요구사항을 파악하여 문서화하는 체계적인 방법으로 비즈니스 프로세스 자동화를 목표로 하고 있으며, 프로세스 중심의 개발 방법 특징데이터 흐름 지향으로 프로세스 위주의 분석과 설계 방식모듈의 분할과 정복에 의한 하향식(Top-Down) 설계 방식다른 프로세스로 순차적 진행하는 폭포수 모델이 기본소프트웨어의 개발이 목표인 프로세스와 산출물의 구성연속(..
엘라스틱 서치를 써야 하는 8가지 이유 Schemaless와 문서지향 엘라스틱 서치는 JSON 구조를 사용하여 기존의 RDMS와 같은 엄격한 구조를 적용하지 않는다. 비정형 데이터는 비구조적이며, 스키마(Schema)가 다이나믹하게 변할 수 있다. 전통적인 관계형 구조로 구성할 경우 프로젝트 막바지에 모든 스키마를 변경하고, 데이터를 다시 구성하는 문제에 봉착할 수 있는데 JSON 구조는 이런 문제들을 사전에 막을 수 있다. 또다른 장점으로 데이터 공간을 절약할 수 있다. 컬럼을 동적으로 정의하여, 필요한 데이터만 넣게 되어 데이터 공간 및 CPU 사용량, 네트워크 트래픽도 줄일 수 있는 효과를 볼 수 있다. 아래의 예시를 한번 보도록 하자 데이터 예시 1{ "title":"엘라스틱에 대하여", "aut..