의사결정나무의 생성 방법 모든 의사결정나무 알고리즘은 공통점을 가지고 있는데, 바로 부모노드보다 더 순수도가 높은 자식노드를 만든다는 것이다. 순수도가 높은 자식노드를 만들면, 또 그 자식노드의 자식노드는 상위 노드보다 순수도가 높고, 이를 반복하여 의사결정나무를 만들게 된다. 1. 분기의 발견 의사결정나무 생성의 과정을 위해서, 사전에 분류된 레코드들로 이루어진 Training Set(훈련용 집합)이 필요하다. 훈련용 데이터 집합은 입력변수뿐 아니라 목표변수 값도 알고 있어야 한다. 어떤 사례에 대해서 학습을 하려면, 입력값 뿐만 아니라 목표변수 값도 알고 있어야 학습이 되는데..예를 들자면, 어떤 장바구니의 내용에 아래와 같은 물건들이 있다.담배, 남성용 팬츠, 와이셔츠 등의 물건(입력값)을 구입했다..
오프라인 교육에서, 이러닝 패러다임을 지나 지금 전세계는 MOOC 패러다임의 시대로 왔다. MOOC란 Massive Open Online Course로서, 직역하자면 대규모 공개 온라인 수업정도로 이해하면 될 것이다. 현재, K-MOOC가 출범하고 어느정도 시간이 흘렀는데 MOOC는 과연 무엇일까?? MOOC의 흐름을 배우기 앞서, 현재 전세계적으로 불고 있는 Open 바람을 먼저 알아야 할 것이다. 빅데이터가 뭔지 모르는 사람은 현재 거의 없을 것이다. 그만큼 IT뿐만 아니라 기업의 생태계에 변화를 주었으며, 아직도 진행중인 이 빅데이터를 본격적으로 전세계에 알리게 된 건 누가 뭐라고 해도 오픈소스 하둡(Hadoop)이었다. 이미, 대규모의 고객 데이터를 다루고 있는 대기업들은 빅데이터를 진작부터 활용..