데이터와 정보 #1 - ADsP 요약

    한국 데이터베이스 진흥원(DBguide)은 좀 공부하는 사람들을 생각해서, 전자북을 개방하든 DAP(데이터 아키텍처 전문가)나 SQLP(SQL 전문가)와 같이 사이트에서 공개를 한 것처럼 ADP(데이터분석 전문가)혹은 ADsP(데이터분석 준전문가) 교재도 좀 공개를 했으면 좋겠다. 출퇴근에 약 1000 page나 되는 것들을 갖고 다닐수도 없는 노릇인데 1000페이지 가까이 되는 책을 전자북이나 요약북 등을 제공하지 않는다는 것은 오로지 공부는 네 집에의 책상에서만 하라는 것과 같을 것이다.

     

    누구는 이동하면서 보고도 싶고, 간편하게 컴퓨터로도 보고 싶은데 시대에 역행하는 DBGuide를 보면 할말이 없다. 다른 사람들도 힘들거라 생각해서, 어느정도 내용을 요약하거나 보충하는 부분들을 사이트에 정리할까 한다. 

     

     


    제1절 데이터와 정보

    데이터의 정의

    - 데이터(Data)라는 용어는 영국의 1640년대에 등장하였다. 라틴어인 dare(주다)의 과거분사형으로 '주어진 것'이라는 의미로 처음 사용되었다.

     

    The first English use of the word "data" is from the 1640s. The word "data" was first used to mean "transmissible and storable computer information" in 1946. The expression "data processing" was first used in 1954. - https://en.wikipedia.org/wiki/Data -

     

    현대에 이르러, 옥스퍼드 대사전의 데이터의 정의를 살펴보면 '추론과 추정의 근거를 이루는 사실'로 정의하고 있다. 이는 단순한 객체(객관적인 사실, Fact) 뿐만 아니라 다른 객체와의 상호관계 속에서 가치를 갖는 것(근거, Basis)으로 설명할 수 있다.

     

    객관적인 사실로의 데이터는 우리가 흔히 볼 수 있는 온도, 습도와 같은 정량 데이터(Quantitative Data)와 언어, 문자 등의 정성 데이터(Qualitative Data)로 구분할 수 있다.

     

    처음 정성적 데이터와 정량적 데이터를 들었을 때 헷갈릴 수 있는데 이렇게 이해하면 된다. 정량적 데이터는 숫자와 같이 값이 딱 떨어지는 데이터등을 말한다. 온도, 습도 뿐만 아니라 사람을 표현하자면, 키, 나이, 몸무게와 같이 Fact인 수치와 같은 데이터가 정량적 데이터이다.

     

    정성적 데이터는 정량이 안되는 데이터를 뜻한다. 예를 들어, "A씨 성향은 진보주의적이다"라는 문장이 있으면 이것은 정성적 데이터가 될 수 있다. 물론, 사람의 성향을 모두 보수와 진보로 분리하여, 1(진보), 2(보수)라는 값을 주어지게 한다면, 정량적 데이터가 될 수 있겠지만 일반적으로 문장이나 단어등과 같이 측정이 힘든 데이터를 정성적 데이터라 한다.

     

    정량적 데이터는 데이터의 의미를 쉽게 파악할 수 있기 때문에 이미 오래전부터 사용하고 있었으며, 통계와 같이 압축을 할 수 있는 방식이 존재했기에 데이터의 관리 또한 용이하였다. 반면 정성적 데이터는 압축할 수 없는 데이터이고 의미를 파악하기 힘들기 때문에 사용하기 힘들었다.

     

     

    암묵지와 형식지

    데이터는 암묵적 지식(tacit knowledge, 이하 암묵지)와 형식적 지식(explicit knowledge, 이하 형식지)의 상호작용에 있어 중요한 역할을 한다. 암묵지는 학습과 체험을 통해서 개인이 습득한 것 지식을 뜻한다. 예를 들어, 스타크래프트라는 게임을 할 때 스스로 컴퓨터와 대전을 통해서 여러가지 빌드업을 체득했다면 이것은 암묵지라고 한다.

     

    예를 들어, 컴퓨터와 대전하면서 나만의 빌드업이 생겼다면 이는 암묵지가 된다

     

    이 세상의 놀라운 발견들은 대다수가 암묵지를 통해서 나타났다. 예를 들어, 상대성 이론을 발견한 아인슈타인이라든지 사과를 떨어진 것을 보고 만유인력을 깨달은 아이작 뉴턴이라든지, 아르키메데스가 목욕을 하다가 탕에 물이 넘치는 것을 보고 유레카를 외친 것 등등 모두 개인의 경험을 통해서 얻은 고귀한 발견, 경험들이라 할 수 있겠다.

     

    그에 반면 형식지는 지식이 형상화된 것을 말한다. 책이나 유튜브, 교과서, 매뉴얼 등등 지식의 전달과 공유가 있는 대상으로부터 지식을 깨달았다면 이것은 형식지를 통한 지식의 습득이라 할 수 있겠다. 스타크래프트를 할 때 내가 스스로 깨달은 것이 아니라, 스타크래프트 결승전을 보거나 Replay를 보면서 새로운 빌드업을 했다면 이것은 형식지인 것이다.

     

     

    암묵지와 형식지의 상호작용

    지식은 이와같이 개개인이 알고 있는 소중한 지식을 형식지로 표현하는 것이 중요하며, 이와 같은 활동(혹은 모델)이 잘 정리된 모델로 Nonaka의 SECI 모델이 있다.

     

    Seci 모델

     

    경험을 통해 개인에게 축적된 내면화(Internalization)된 지식을 조직의 지식으로 공통화 혹은 사회화(Socialization)하기 위해서 개인의 지식을 언어나 숫자 등의 형태로 표출화(Externalization)하고, 이를 다시 개인의 지식과 연결화 혹은 조합화(Combination)하여 새로운 경험이 축적되고 다시 내면화 하는 과정이 반복되는 나선형 구조로 반복하게 된다.

     


    ※ 내용을 이해하였다면, 볼드체로 칠한 부분을 외울 수 있도록 해보자

     

     

    참고자료

    https://en.wikipedia.org/wiki/Data

    https://ko.wikipedia.org/wiki/%EC%95%94%EB%AC%B5%EC%A0%81_%EC%A7%80%EC%8B%9D

    https://changemakerobs.wordpress.com/2013/04/20/what-is-knowledge-management/

    (도서) 데이터 분석전문가 가이드 (ADP) (ADsP)

     

     

     

    댓글

    Designed by JB FACTORY