1. 의사결정나무란? 분류와 예측 모두에서 자주 쓰이는 강력한 기법이다. 일련의 단순한 의사결정 규칙들을 적용시켜 큰 레코드의 집합을 작은 레코드의 집단으로 나누는데 쓰이는 구조이다.대표적인 예로는 1730년대에 칼 린네가 개발한 생물들을 나눈 종속과목강문계가 좋은 예시이다. 2. 의사결정나무로 할 수 있는 것들분류 : 종속과문강문계와 같이, 특정한 규칙과 패턴등을 토대로 데이터를 분류하는 방법이다. 의사결정나무는 이해가 쉽고 명확하기 때문에 분류에 많이 쓰인다.점수화(스코어링) : 점수를 책정할 수 있다. 분류등을 수행 후, 해당 값에 맞는 값을 책정하여 스코어링이 가능하다.추정 : 연속형 값을 추정하는데 사용하는 것은 그다지 좋은 생각이 아니지만, 추정하는 것도 가능하다.- 좌측은 의사결정나무, 우측..
오프라인 교육에서, 이러닝 패러다임을 지나 지금 전세계는 MOOC 패러다임의 시대로 왔다. MOOC란 Massive Open Online Course로서, 직역하자면 대규모 공개 온라인 수업정도로 이해하면 될 것이다. 현재, K-MOOC가 출범하고 어느정도 시간이 흘렀는데 MOOC는 과연 무엇일까?? MOOC의 흐름을 배우기 앞서, 현재 전세계적으로 불고 있는 Open 바람을 먼저 알아야 할 것이다. 빅데이터가 뭔지 모르는 사람은 현재 거의 없을 것이다. 그만큼 IT뿐만 아니라 기업의 생태계에 변화를 주었으며, 아직도 진행중인 이 빅데이터를 본격적으로 전세계에 알리게 된 건 누가 뭐라고 해도 오픈소스 하둡(Hadoop)이었다. 이미, 대규모의 고객 데이터를 다루고 있는 대기업들은 빅데이터를 진작부터 활용..
1. 데이터 마이닝 데이터 분석, 즉 데이터 마이닝은 Mining 이라는 단어에서 알 수 있듯이, DATA에서 의미를 추출, 캐는 작업을 뜻한다. 좀 더 쉽게 풀이하자면 데이터 안에서 통계적 규칙이나 패턴등을 찾는 행위 및 도구, 기법등을 뜻한다. 빅데이터가 단순히 테라 이상급의 DATA만을 의미하는 것이 아닌 데이터 마이닝도 행위만을 뜻하는 것은 아니다. 위 그림을 보면, 알겠지만 0,1의 Digit들을 정제하여 의미를 찾아내는 것이라고 이해하면 된다. 2. 데이터 마이닝의 절차 데이터마이닝의 일반적인 절차는 우선 데이터를 선택하고, 정제한다.정제된 데이터를 특정 형태로 변형을 한 후, 데이터 마이닝을 거치고 해석을 하는 단계까지 이어지는 비교적 단순한 과정이다. 이를 실생활로 이해를 해보도록 하자. ..
OSI 7 Layer 란? 소프트웨어 공학을 이해하기 위해서, 제일 처음에 SDLC(Software Development LifeCycle)를 이해한다고 한다면, 네트워크를 이해하기 위한 가장 첫번째 발걸음이 OSI 7 Layer라고 할 수 있다. OSI 7 Layer는 국제표준화기구(ISO)에서 개발한 모델로서 추상적인 모델이다. 개발로 따지면, Interface를 정의한 것으로 볼 수 있는데 "이렇게 만들면 된다" 정도의 가이드라고 생각하면 된다. OSI 7 Layer의 탄생배경 OSI 7 Layer가 탄생한 이유는, 호환성 문제 때문이었다. (사실 대부분 표준이 이러한 이유로 탄생이 되긴한다.) 여러 통신 업체의 장비들이 상호호환성이 없었기 때문에 벤더간의 종속성 및 비용 증가로 연결이 되었다. I..
인공지능이라는 개념을 제일 처음 만든 사람은 누구일까? "이미테이션 게임"이라는 영화를 본 사람은 튜링이 마지막에 기계와 인간 사이에서 혼란을 느끼는 장면에 의아해 했을 것이다. 앨런 튜링은, 최초의 컴퓨터(물론 기준을 어떤걸로 잡느냐에 따라서 최초냐 아니냐 말이 많다.)를 만드는 것부터 시작해서 인공지능의 개념까지 만든 컴퓨터계에서 입지전적인 인물이다. 베네딕트 컴버배치와 전혀 안 닮았지만, 왠지 튜링은 베네딕트와 더 어울린다.;;; 사람들마다 인공지능에 대한 기준이 존재한다. 누구는 정말 인간같이 똑같이 생각하는 마치 "매트릭스"에서의 컴퓨터 수준의 인공지능으로 볼 수 있지만, 앨런 튜닝은 간단했다. 인간이 컴퓨터와 대화를 하는데 컴퓨터를 사람으로 착각한다면, 해당 컴퓨터는 사고를 가지고 있고, 그것..
가트너 10대 전략 기술이란, 리서치 전문기관 가트너가 매해 발표하는 새해의 주목할 만한 기술을 뜻한다. 워낙 IT분야에서는 상징적인 기관이라서 IT분야를 좀 아는 사람은 가트너의 발표를 보고 그해에 뭘 준비해야 될 것인지 미리 판단을 하게 된다. 사회, 경제로 따지면 타임지의 그해의 인물같은 느낌이라고 할까? 거두절미하고, 올해에는 또 어떤 10대 전략이 있는지 확인해보도록 하자. 올해에도 역시나, 3가지의 대그룹으로 묶어주셨는데 The Digital Mesh, Smart Machine, The New IT Reality 첫째, Digital MeshThe Device Mesh, Ambient User Experience, 3D Printing Materials 수많은 디바이스 들이 서로간의 Mesh(..
PIM, 지능형반도체는 현재 국가에서 핵심 전략으로 밀고 있는 기술중에 하나이다. 인공지능으로 구글이 알파고라는 바둑 프로그램으로 치고 나가고 있다면, 현재 지능형 반도체는 IBM이 "트루노스(True North)"라는 반도체로 나아가는 중이다. 미국 컴퓨터 회사인 IBM과 코넬대학교가 공동 연구하고 삼성전자가 28nm 제조공정을 통해 구현한 뉴로모픽칩으로 2014년 8월 과학저널 사이언스 온라인판을 통해 공개되었다. 인간의 뇌는 1000억개의 뉴런(신경세포)과 약 100조개의 시냅스(연결부위)로 이루어져, 가변적으로 데이터를 동시 처리, 저장하기 때문에 엄청난 대용량의 동영상 정보를 빠르게 인식하게 된다. 이러한 뇌의 기술을 착안하여, 만든 반도체가 앞으로 뜰 지능형 반도체이고, 현재 상징적인 프로그램..
사실 이런 글을 포스팅할 이유는 없지만, 개발을 이제 막 시작한 분들이나 이쪽 계통에 대해서 잘 모르는 분들을 위해서 간단히 포스팅해 보도록 한다. Mysql을 설치하려 오신 분들은 이 참에 MariaDB를 설치해보도록 한다 (둘은 만든 사람이 같으나, MariaDB는 완전 무료고, Mysql은 부분 무료이다) MariaDB로 개발해도 Mysql과 동일하기 때문에 개발 및 진행상에 아무런 문제가 없다. 심지어, MariaDB를 설치할 때 서비스명까지 Mysql로 뜨는 쌍둥이로 봐도 무방하다. http://needjarvis.tistory.com/10 (MariaDB와 Mysql의 포스팅 참고) MariaDB는 https://downloads.mariadb.org/ 에서 다운로드가 가능하며, 현재 내 로컬..
What do “branch”, “tag” and “trunk” really mean? Trunk would be the main body of development, originating from the the start of the project until the present. Branch will be a copy of code derived from a certain point in the trunk that is used for applying major changes to the code while preserving the integrity of the code in the trunk. If the major changes work according to plan, they are usua..
인텔이 만들어낸 기술로 약간의 뻥으로 사람들을 현혹시킨 기술이기도 하다.특정 작업환경에서는 좀 더 효율이 발생할 수도 있다. 예를 들어, 적은 리소스를 사용하는 프로그램들을 여러개 실행 할 경우 이 기능을 끈 것보다는 성능이 좋다. 하지만 동일한 연산을 주로 하는 프로그램에서는 오히려 성능이 줄어들 수 있다. 자 그럼 하이퍼스레딩이 무엇인지 정확히 알아보자.쉽게 이해를 하려면, 사람의 몸으로 설명하는 것이 빠를 것 같아서 사람을 기준으로 설명을 해보겠다. 어려운 수학문제 4개(프로세스 4개)가 존재한다고 해보자.이 문제를 4명이서 각각 하나씩 전담을 하여, 총 1분에 걸쳐서 풀게 되었다.이 개념이 멀티프로세스이며, 사람이 4명이니 쿼드코어(4명)다. 그럼 i3같은 듀얼코어에 하이퍼스레딩을 적용한 경우 어..
High Water Mark 개념 HWM(High Water Mark)은 테이블의 라이프 사이클에서 사용된 블록을 표시하기 위해서 사용되는 용어입니다. 모든 DB가 사용하지 않으며, 대표적으로 오라클(Oracle)에서 사용하는 용어입니다. 기본적으로 HWM은 데이터의 가장 오른쪽(가장 최신)에 있는 블록을 뜻합니다. 그럼 이게 무엇이 중요한가? 바로 데이터가 많아지면 많아질수록 HWM의 개념이 중요지기 시작합니다. 데이터를 Delete 데이터를 삭제(Delete)하면 그 데이터는 어떻게 될까요? 우리 머리속에서는 그 공간을 쏙 없애버릴 것 같지만 사실은 그 공간을 비운채로 지나가게 되어 있습니다. 마치 현생으로 생각하면 빈집들이 있는 것처럼 구멍이 뽕뽕 뚫려버린 공간이 생기는 것이죠. 문제는 이 놈들도 ..
아래 그림 하나로 모든 것을 설명할 수 있는 것이 Stack 이다. 스택은, 선형구조(LIFO) 즉, Last In First Out 기반의 자료구조이고,Push라는 것으로 자료를 저장하고, Pop이라는 연산으로 가장 최근에 저장된 자료를 사용, 삭제하게 된다. 좀 더 쉽게 설명하자면, 접시를 들 수 있는데...접시를 계속 쌓이두면, 사용할 때도 가장 최근에 쌓아둔 접시를 사용하게 된다.... 그럼, 이 불공평(unfair)한 자료구조는 언제 사용하는 것일까?? 대표적인 사용출처는 "인터럽트 처리", "루틴의 복귀", "함수 호출할 때 인수 전달"를 할 때 쓸 수 있다.어떠한 작업을 할 때 현재의 상황에 우선순위의 작업을 등록하여, 처리하고 복귀할 때 스택만큼 좋은 자료구조는 없기 때문이다. 스택에서 사..