기존에 작성했던 아나콘다 설치 방법이 변경돼서 빠르게 재포스팅을 하고자 한다. 변경된 아나콘다 내 기억이 정확한지는 모르겠지만, 기존에 아나콘다는 선택하는 것이 많지 않았다. 마치 완벽한 오픈소스처럼 보였고 상업 라이센스가 존재하지 않는 것마냥 보였던 것으로 기억한다. 그러나 엘라스틱도 그렇고 아나콘다 역시나 최근 들어서 라이센스가 다양화 되었기 때문에 함부로 설치하면 안될 것으로 보인다. https://www.anaconda.com/products/individual 아나콘다의 제품은 현재, 개인, 팀에디션, 엔터프라이즈 에디션, 프로페셔널 서비스로 나뉘며 무료로 쓰는 제품은 individual(개인) 제품을 선택하면 된다. 위 링크는 개인 제품 링크이니 들어가서 다운로드 받으면 된다. 본인의 OS와 ..
암호화폐도 이제 2021년 10월부터 투자소득의 22%를 과세하게 된다. 그나마 다행인건 소득 250만원까지는 세금을 내지 않는 구간이 있다는 것이다. 즉 내가 암호화폐로 500만원의 수익을 올리게 된다면 250만원의 22%의 세금 55만원 정도만 내는 구조이다. 소득이 있는 곳에 세금을 내는건 어쩔 수 없는 과정이었고, 그동안 한국은 늦게 진입하여 대다수가 피해자였기 때문에 암호화폐 과세에 상당히 조심스러운 모습을 보였었지만, 이제 잠잠해지기도 했고 부동산, 주식 모두 건드렸으니 암호화폐도 건드릴 필요성이 보였나보다. 다만 아쉬운건 주식 수준의 거래세를 했으면 어땠을까 싶다. 암호화폐로 1~2% 먹을려는 사람이 없는 것처럼 주식 수준의 거래세 정도는 충분히 투자자들 입장에서 낼 수 있는 것이기에(물론 ..
집이 층고가 높고 통창이 많다보니 여름만 되면 엄청 덥고, 겨울만 되면 추운 집이다. 오로지 뷰가 좋아서 들어간 이 망할 집은 거실에는 에어컨이 있지만 침실과 컴퓨터방에는 에어컨이 없어서 더운 여름에 선풍기를 틀고 살고 있었다. 그나마 다행인것은 내 체질이 추위를 잘 타지만 더위를 많이 타는 성격이 아니라서 그럭저럭 선풍기와 냉풍기들로 버틸 수 있었다. 다만 문제가 있었는데 잘 때 덥다보니, 선풍기를 얼굴쪽 가까이 틀 수 밖에 없었고 고양이들은 선풍기 바람이 신기한지 선풍기쪽으로 오는 바람에 고양이 털이 얼굴쪽으로 날려서 깨는 사태가 하루에 3~4번은 있었다. 그러다보니 하루가 너무 피곤했고 잠을 깨기 위해, 커피랑 몬스터 에너지를 흡입하는 수준으로 마셔서 이러다가 객사할 수 있겠구나 싶어서 결국 에어컨..
기계독해(MRC)는 만드는 사람 맘이기 때문에 사실 다양한 방법들이 존재한다. 챗봇을 하나 만들어도 다양한 기법들이 존재하는 것처럼 챗봇과 본질적으로 유사한 기계독해 역시 마찬가지이다. 다만 기계독해는 문서를 기반으로 공부를 해야 한다는 차이가 있을 것이다. 기계독해 타입들 아래는 필자가 생각하는 기계독해의 타입들이라 생각한다. 물론 다양한 기법들이 존재하지만 대표적으로 몇가지만 끄적여 보았다. 1. 학습없이 진행하는 실시간 타입 가. 질문에 해당하는 가장 유사한 문장을 찾기 나. 해당 문장에서 가장 적합한 답변을 추출하기 이렇게 적으니 엄청 심플해 보인다. 엄청 간단해보이지만, 사실 위 내용을 구현하기 위해서는 인덱스를 추출하고 어느정도 의미를 추출해야만 가능하다. 2. 질문과 문장을 학습한 나름 딥러..
기계독해(MRC)란 컴퓨터에게 질문을 던졌을 때 답을 하는 매우 인공지능스러운 분야이다. 그러나 기계독해라는 것이 한글 기준으로 참 지랄맞은 부분이 있기 때문에 포스팅을 하면서 생각의 정리를 하고자 한다. 처음에 BERT를 봤을 때는 참 만능처럼 보였고, Step by Step으로 KorQuad를 진행하였을 때 뭔지도 모른 상태로 남들이 하라는 대로 하였다. 내 머리속에 기계독해는 문서를 던지면 문서를 통째로 읽고 다음에 질문을 던지면 답변을 하는 녀석으로 생각했지만 KorQuad의 Training 셋을 보면서 의문을 갖게 되었다. 해당 데이터는 문장, 질문, 답변이 세트로 되어있었기 때문이다. 그러다보니 "이 training set은 어떻게 만들지?"라는 의문이 생겼고 저 부분이 기계독해를 만드는데 가..
인터넷 서핑을 하던 차에 저작권으로 재테크를 하자는 광고를 몇번 정도 봤었지만 그냥 무시하고 넘기고 있었다가 오늘 새벽 나도 모르게 궁금해서 클릭하여 사이트에 들어가게 되었다. 들어간 사이트 명이 "뮤직카우"인데 우리나라 대중가요의 저작권을 거래하는 사이트였다. 뮤직카우 이전에는 뮤지코인이라는 이름으로 운영 하였는데 아무래도 부정적인 느낌(가상화폐 거래와 같은 느낌이 있으니)이 있는지 이름을 변경하였다. 처음에 이게 어떻게 가능하지? 사기 아닌가? 싶다가 내용을 읽어보고 저작권에 참여한 유명 작곡가들을 보고 그리고 뉴스로 한국 저작권 협회와 MOU를 체결한 기사를 보고 사기가 아님을 확인할 수 있었다. 물론 아직도 몇가지 의문점(예를 들어 회사가 망했을 때 저작권을 어떻게 처리할 것인지)이 남긴 하지만...
Geforce 그래픽카드의 경우 자체적으로 내장된 화면 캡쳐 프로그램으로 인해서 영상 플레이어가 제대로 작동이 안되는 경우가 종종 있다. 대표적으로 인강 같은 경우 동영상 캡쳐 프로그램에 민감하기 때문에 철저하게 막고 있는데, 캡쳐 프로그램을 설치한 적도 없는데 저런 오류가 뜨는 경우 난감하기도 하고 뭐가 뭔지 알기 힘들 것이다. Step by Step 우선 우측 하단에 상주하고 있는 Geforce 아이콘을 선택을 한다. Geforce 아이콘을 찾지 못했다면, 검색으로 Geforce Experience를 찾아본다. 위 화면은 필자의 Geforce 홈화면이다. 플레이 중인 게임을 최적화 한 것으로 최적화된 게임이 없을 경우 다른화면이 나올 수 있다. 설정아이콘을 클릭한다 설정아이콘을 클릭하면 위와 같은 설..
2020년에는 왠지 5G로 인해서 온 세상이 스마트해 질거라 생각했는데 올해에는 재앙의 해로 기억이 될 것만 같다. 그와 반대로 재앙으로 인해서 지구가 다시 살 수도 있겠다는 생각이 드는 것이 결국 인간의 사치를 지구가 가만히 두고보지 않는다는 법이다. 올해초에 기후위기에 관련된 포스팅을 쓴 적이 있는데 지구가 인간의 결과물들에 대해서 이렇게나 빨리 반응 할 줄은 예상하지 못했다. 인구와 문화의 발전이 문제 사실 가장 큰 문제는 불어나고 있는 인구와 함께 소외된 나라들이 성장을 하면서 생기는 온실가스 이산화탄소(CO2), 메탄(CH4), 아산화질소(N2O), 수소불화탄소(HFCs), 과불화탄소(PFCs), 육불화황(SF6)의 배출 문제이다. 우리나라는 사실 온실가스들을 적극적으로 배출한 덕에 빠르게 성장..
PUT과 POST를 비교하여 데이터를 저장하는 것을 한적이 있는데 이번에는 PUT과 POST를 활용하여 데이터를 갱신(update)하는 것을 실습해본다. 해당 포스팅의 내용은 키바나를 연결하여 console 창에 테스트를 진행하며, 만약 사용하는 방법을 모르고 있다면 [키바나] 설치 및 엘라스틱서치 연동 위의 내용을 확인하여, 우선 키바나를 설치하고 콘솔창을 활용하는 법을 익히도록 하자 PUT 명령어로 갱신 PUT로 데이터를 갱신하는 방법은 다음과 같다. PUT /// { 내용... } PUT으로 데이터를 입력해보았으면 위 내용이 입력하는 방법과 동일한 것을 알 수 있을 것이다. PUT은 데이터가 있으면 UPDATE로 수정을 하고, 없을 경우 INSERT를 실행하는 즉 INSERT_OR_UPDATE 명령..
엘라스틱서치(Elastic search)에서 매우 쉽게 데이터를 가져오는 방법으로 GET 명령어를 활용하는 방법이 있다. 예를 들어, 내가 어떤 레코드들의 데이터 ID를 알고 있다고 가정을 해보자. PUT으로 데이터를 저장하였다면, 아이디를 애시당초 입력을 하기 때문에 GET으로 데이터를 가지고 오는데 전혀 문제가 없을 것이다. GET으로 가져오기 GET /// GET 명령어는 PUT과 사용법이 동일하다. 다만 PUT은 입력할 데이터를 추가로 적지만, GET은 인덱스, 타입, 아이디까지만 입력하면 된다. { "_index" : "article", "_type" : "_doc", "_id" : "2", "_version" : 1, "_seq_no" : 1, "_primary_term" : 1, "found..
엘라스틱서치에서는 데이터를 핸들링하는 CRUD 명령어를 강력하고 깔끔한 Rest API형태로 제공하여 쉽게 데이터를 검색, 저장, 갱신, 삭제 등의 작업을 할 수 있다. 그 중 처음에는 뭘 써야 될지 헷갈릴 수 있는 Put과 Post의 대한 차이를 설명해보고자 한다. 이전 포스팅에서는 데이터를 저장하는 방식으로 Put만 설명하였는데 마찬가지로 데이터를 저장하는 Post 명령어를 사용한 후 어떤 상황에서 써야 하는지 이해해보자 PUT으로 저장하기 데이터를 매우 쉽게 넣을 수 있는 Put 명령은 다음과 같은 구조를 가진다 PUT /// put 예제 PUT /article/_doc/2 { "article_no":"20200707085400", "title":"삼성전자 2분기 영업이익 8조1천억원…'어닝서프라이..
노드(Nodes) 엘라스틱서치는 분산 시스템이며 노드는 이 분산 시스템에서 작동하는 하나의 엘라스틱서치 엔진(single server)을 의미한다. 이 노드들은 우리가 생각하는 일반적인 엘라스틱서치 엔진이며(내 컴퓨터에 엘라스틱서치를 한개 설치하였다면 하나의 노드를 설치한 것과 동일하다) 데이터의 저장과 색인(Index), 검색(Search) 모두 가능하다. 노드는 엘라스틱서치에서 고유의 아이디값으로 UUID(Universally Unique IDentifier)를 제공하며 원할 경우 노드의 고유의 아이디를 내가 직접 변경할 수 있다. 노드의 값을 변경하기 위해서는 엘라스틱치 설치된 위치에 config 폴더에 들어가면, 다양한 설정값들이 존재한다. 엘라스틱서치폴더/configelasticsearch.ke..