머신러닝(Machine Learning) 즉, 기계학습이란 컴퓨터가 학습을 통해서, 기계에게 지식을 주입하는 것을 말한다. 우리가 어떠한 사람에게 "우리나라 수도인 서울은 대한민국에서 가장 인구가 많은 도시야"라고 누군가에게 지식을 전달 했을 때, 그 지식을 습득한 당사자는 "한 나라에서 인구가 가장 많은 도시는 수도일 확률이 높겠군"이라고 생각할 수 있다. 즉 이러한 어찌보면 확률을 컴퓨터에게 심어주는 것이 머신러닝이다. 기계학습의 종류는 크게 지도학습과 비지도학습으로 나뉘는데 최근에는 딥러닝으로 인해서 강화학습이 추가되어 3가지로 나뉘는 경우가 많다. 그럼 각각의 학습에 대한 정의는 무엇이고, 어떠한 알고리즘이 있는지 확인해보도록 하자 1. 지도학습(Supervised Learning) 가장 기본이 ..
A.I에서 알고리즘으로 어떤 해답을 탐색한다는 것은 다른 말로 바꿔 말하자면, 문제를 해결(Problem Solving)하는 과정이라고 표현할 수 있다. 다양한 알고리즘들이 문제를 해결하는 방법을 가지고 있다. 어떤 리스트를 소팅(Sorting)해라라고 할 때 하나의 알고리즘만으로 소팅하지 않는다. 데이터의 구조 및 상황에 따라서 적절한 알고리즘을 선택하여 정렬을 수행하는데 A.I 역시 하나의 방법으로만 탐색(즉, 해답을 찾는..)을 하지는 않는다. 탐색 알고리즘 중에 상태 공간 탐색이라는 방법(혹은 알고리즘)이 있는데 이 방식은 제목에서 알다시피 상태 공간을 이용한 탐색방법이다. 상태 공간 탐색은 여러가지 대표적으로 잘 알려진 문제를 해결할 수 있는데 대표적으로 "퍼즐", "틱택토(tic-tac-toe..
칸반 방법론은 스크럼과 같이 국내 애자일 방법론계에서 상당히 핫한 방법론이다. 칸반이라는 용어는 간판의 일본어지만, 도요타 생산 시스템(TPS)에 있는 칸반이라는 카드에서 사용한 것을 의미한다. 즉 한자는 같더라도 내용은 다르다는 것... 사실 애자일이 다 그렇듯 별거 없다. 용기와 자신감과 잦은 소통과 짧은 회의 등등 이런것들이 애자일의 핵심인데 칸반도 그 방법론에 크게 벗어나지 않는다 다만 개발자들이 작업을 하는 것을 "간판(카드)"에 적어(혹은 포스트잇)서 시각화를 하는 것이 핵심이다. 우리가 말로서 누군가를 관리하고, 혹은 WBS를 열심히 작성하더라도 업무를 정확하게 파악하기란 힘이 든다(팀원이 많아지면 정말 골치 아프다) 칸반 기법은 이 관리를 상당히 단순화 시켜주고, 입체적으로 알수 있게 해준..
고속 응용 프로그램 개발(Rapid Application Developement, RAD) 또는 고속 응용 프로그램 개발 도구(Rapid Application Development Tool)는 소프트웨어 개발 방식의 하나로, 빠르고 쉽게 응용 프로그램을 만들 수 있는 시각적 도구 혹은 개발 모형이다. 한마디로 툴을 사용해서, 디자인을 하고, Code Generator를 활용하여 프로그램을 빠르게 개발하는 기법으로 쉽게 생각하면 된다. 대표적인 툴로는 파워빌더, Visual C#, Miplatform 같은 플랫폼이 있다. 만능인 것처럼 보이고, 개발자가 아닌 PM이나 기획자 입장에서 매우 매력적으로 보일지 모르겠지만, 전세계가 아직 자바의 시대에서 벗어나지 못한 이유는 언어의 한계도 있지만 툴로서의 기능의..
반복적 모형은 솔루션 업체들이 가장 선호하는 방법일 것이다. 바로 한번에 모든 것을 만들어서 오픈 하는 것이 아닌 핵심을 먼저 만들고, 나머지를 점진적으로 업데이트를 하여 최종 시스템을 완성하는 모델이다 프로토타입과 나선형 모델과 비슷한 느낌을 주지만, 프로토타입은 시제품을 만들어서 가능성 여부를 먼저 점검한 후 개발을 시작하는 것이고, 나선형 모델은 상당히 비슷하지만, Risk가 중심이 된 것이 나선형 모델이다. 반복적 모델은 2가지 방식이 있는데 증분형(Incremental) 모델과 진화형(Evolution) 모델이 존재한다. 증분형은 동시에 여러가지 업무를 진행하여, 나중에 합치는 작업이 들어간다면 진화형은 작업이 순차적으로 진행이 되면서, 프로그램이 계속 수정 작업을 거치며 진화하는 것이다. 1...
통계학은 이미 많은 범위에서 적용이 되고 있다. 마케팅, 추천, 경영 등등 안쓰이는 것이 없을 정도로 통계는 실생활에 가장 밀접히 다가간 수학적인 학문이 아닐까 싶다. 요즘 R툴이 범용적으로 쓰이고 있고, 회사에서도 데이터분석에 많은 관심을 갖다보니 회의때 통계에 관련된 용어가 심심치 않게 나오는 것을 볼 수 있을 것이다. 통계를 모르면, 회의때 왕따를 당하는 것 같은 소외감이 느껴지기도 할텐데 최소한 이런 소외감을 당하지 않기 위해서는 어느정도의 통계에 관련된 용어는 알아야 될 것이다. 물론 중고등학교때 통계에 대해서 배우지만, 사실 시간이 오래지나서 헷갈리기도 하고 안배웠던 분들도 분명 있을 것이다. 지금 설명하는 통계 용어는 통계를 알기 위해서 최소한에 이해해야 할 지식이다. 모집단(母集團, pop..
넥서스(Nexus)는 "Nexus is a connection or series of connections, 여러가지 것의 복잡한 결합 및 연쇄"라는 의미 넥서스 경영은 L자형 경제성장(저성장의 장기화로 인한 그래프 모양)으로 그에 따른 전략 역시 다르게 가져가야 한다는 것에서 유래된 경영 패러다임이다. 올해도 여전히 저성장율을 기록할 것으로 보이며, 2010년 갤럭시를 선두로 모바일폰이 반짝 하던 해 이후로 꾸준히 2~3프로를 왔다 갔다 찍고 있는 실정이다. 4차 산업혁명 시대라고는 하지만 아직 실체가 보이지 않기 때문에 올해 말까지도 별다른 반응이 보이지 않을 수 있고, 외부적으로 북한의 핵실험, 수소폭탄 실험 및 중국의 사드보복 조치로 인하여 북한에 대해서 특별히 화해 모드가 조성이 되던지 아니면 ..
아이폰4 -> 아이폰5s -> 아이폰7 Plus를 쓰고 있는, 애플 빠돌이로서 이번에 아이폰 발표때, 아이폰 SE2를 기다렸지만, 역시나 아이폰 X와 아이폰8를 발표하고 말았다. 언제부턴가 애플이 아이패드도 미니를 출시하지 않고 있고, 휴대폰도 4인치를 출시하지 않는 것을 보면 아마도 내부적으로 오히려 프리미엄 폰을 살 수 있는 고객이 애플의 중저가 폰을 사는 것이 유익하지 않다는 판단을 해서일지 모르겠다. 아이폰이 새로 밀고 있는, 아이폰 X 그러나, 문제는 다른 것에 있다. 일단 아이폰 SE가 쌩쌩하게 잘 돌아간다. 아이폰 SE는 아이폰 6S와 동급의 폰이다. 6S는 현재 매우 잘 돌아가고 있는 폰이고, 원래 애시당초 SE를 사용하는 유저는 헤비한 앱을 사용하지 않는 사람들이다. 간단하게 인터넷을 검..
업무 때문에 Personality Insight를 사용해야 되서, API를 뒤적뒤적거리며 사용해봤다. Bluemix를 쓰면 매우 간단하게 처리가 된다고 하나 뭐 어쨌다나... Bluemix의 영문으로 된 사이트를 쳐다보면서, 정말 IBM이 한국에 지사가 있는게 맞는건지 의문이 들었다. Personality Insight라는 것은, 사람의 성향을 분석하는 왓슨의 솔루션인데 하라는 대로 콜을 해도 잘 작동이 되지 않았다. 데모사이트를 가면, 한글이 없었다(뭐냐 이건...서비스 맞나?) 분명이 한글이 된다고 들었는데 데모에는 일본어, 스페인어, 영어 정도밖에 안되는걸로 보였다. Response에서 성향 설명은 한글 지원이 됐다. 한마디로 일본어, 영어 등을 넣었을 때, 대답은 한글이 된다는 것이었다. 안되서 ..
누구를 구입한지 꽤 오랜 시간이 흐른 것 같다. 2017년 4월에 구매를 했으니, 약 5개월 정도가 지난 것인데 그동안 누구를 사용하면서 가감없는 사용후기를 올려볼까 한다. 누구를 구매하게 된 사유는 마침 챗봇을 만드려고 했었고, SK는 어떻게 학습 시키는지 그리고 CF의 감성적인 부분이 먹혀서 구매를 하게 됐다. CF를 보면, 아리(누구의 캐릭명)가 마치 사용자와의 대화를 잘 이어나가는 것처럼 보였다. 날 낚은 CF... 제품 구매 인증 지름신이 강림하여, 떨리는 마음으로 인공지능 스피커를 작동을 하고 또 설레는 마음으로 대화를 시작했다. 그러나.. "띵~ 제가 대답하기 어려운 말이네요..." 헉!! 계속 못알아 듣기 시작한다.뭐지, 나랑 대화하는 것을 학습하는거 아니었나?? 음성인식이 왜 이러지? 사..
퍼지이론은 자연 현상의 불확실한 상태를 수학적인 개념을 통해 표현해 주는 방법으로 1965년 미국 버클리대학교의 교수 롯피 자데(Lotfi A. Zadeh)에 의해 최초로 제안되었다. 퍼지이론은 흔히 많이 사용되는 보통집합의 개념을 확장 또는 일반화한 것으로 일정한 구간으로 표현된 값이나 언어적 표현 등과 같이 애매하거나 불확실한 정보를 모델화하고 수식으로 처리할 수 있는 수학적인 도구로 다양한 분야에서 활용되고 있다. Lotfi A. Zadeh 퍼지집합은 어떤 모임에 속한다 또는 속하지 않는다는 이진법 논리로부터, 그 모임에 속하는 정도를 소속함수(membership function)로 나타냄으로써 수학적으로 표현할 수 있다. 또한 퍼지측도(fuzzy measure)는 일반집합 A에서 위치가 애매한 원..
1. 아파치 스파크(Apache Spark)란? 아파치 스파크(Apache Spark)는 빅데이터(Bigdata) 처리를 위해서 등장한 오픈소스 병렬분산처리 솔루션, 플랫폼이다. 빅데이터가 한창 떴던 당시 전세계는 빅데이터 열풍과 동시에 "빅데이터 = 하둡(Hadoop)"이라는 생각을 했을 만큼 하둡의 등장은 센세이션 했었다. 문제는 하둡의 등장은 2010년 즈음이고, 그때와 지금과는 데이터가 하늘과 땅차이가 날 정도로 패러다임이 다시 바뀌게 되었다. 하둡은 기본적으로 HDFS(Hadoop Distributed File System)라고하는 분산 저장 파일 시스템과 맵리듀스(MapReduce)라고 하는 데이터 처리 방식으로 인해서 한 획을 그었는데 문제는 HDFS는 디스크의 I/O를 사용하는 것이고, 결..