블락비 박경이 마치 술김에 실수로 써내려갈 법한 가수들의 실명을 거론한 "사재기 연예인들"이라며 올린 트위터 글은 연예계에 대형 폭탄을 투하시켰다. 해당 글을 보면 마지막에 "^^" 웃는 이모티콘을 추가하였는데 이를 토대로 보면 박경은 실수가 아니라 "비꼬는 글"이라는 즉, 고의성이 다분한 연예계의 의사(義士)가 되어 버렸다.
혹자는 열사(烈士)라고 하지만, 박경은 열사보다 의사라는 표현이 좀 더 정확하다 생각한다. 왜냐... 비록 인터넷 공간이지만 충분히 데미지를 줄 수 있는 저격을 하였으니까!!
2019년 한해에는 정말 연예계에 숱한 사건들과 화제의 인물들이 많았다. 장성규로 시작한 화제의 인물은 펭수, 유산슬로 이어지며 정말 한해 동안 많은 "스타"들이 새로 등장했으며, 설리, 구하라라는 톱스타의 자살은 연예계의 음지와 양지를 모두 보여주는 사건이 아닐까 싶다.
필자는 어느순간 멜론 TOP 100을 듣지 않는데 어느순간 듣도보도 못한 잡(?)가수들이 차트인을 하면서 이별 노래를 불러제끼는 모습에 짜증이 나면서부터다. 멜론을 쓰지 않을까 싶었지만, 집에 있는 SK 누구(Nugu) 스피커가 멜론이랑 연결되어 있어서 해지도 못하기도 하고, 그냥 내가 TOP 100을 듣지 않으니 걍 집에서 누구한테 "펑키한 음악 틀어줘"라는 명령어로 멜론 서비스를 사용중이다.
그것이 알고싶다에서 박경이 터트린 핵폭탄에 기름을 붓는다는 소식이 있고 난 후 오랜만에 그알을 보게 되었다. 그러면서 한때 인터넷에 떠들썩했던 아이디 도용이나 듣지도 않았던 음악을 몇백번씩 들었다고 나오는 것 등 사건등을 나름대로 생각해보게 되었다.
기름 부어준 그알...
과연 멜론은 알수가 없는 것일까? 모르는 척 하는 것일까?
필자의 직업은 바로 이런 것을 분석하는 데이터 분석가이기 때문에 내가 멜론에 속해있는 직원이라면 알 수 없을까? 모르는 척 하는 것일까? 분석해보기로 했다.
일단 몇가지 사건들만 나열해보자(Fact)
- 아이디를 도용당해서, 원치 않은 음악을 몇백번씩 들었다고 나오는 경우가 있었다.
- 아이디를 무작위로 생성하여 음악을 들었다.
- 특정 시간대에 특정 노래의 순위를 끌어 올렸다(팬덤 파워보다 위)
방송을 보면서 너무 많은 증거를 확보할 수 있었다 생각한다. 그리고 이를 토대로 분석 가능성을 열어보았다.
어뷰징을 찾을 수 있는 방법
곡을 시계열로 아이디를 군집화
닐로나 장경철, 바이브, 송하예 등등 이런 팬덤이 없는 가수들의 순위를 올리기 위해서는 처음부터 순위권에 올라가지 못하고, 저 밖에 있는 노래의 순위를 끄집어 올려야 한다. 즉, 해당 곡의 시간대별 듣는 사람들을 찾게되면 급작스럽게 듣고 있는 사람들의 집단을 알 수 있다. 이는 매우 쉬운 분석이며, 해당 집단의 아이디들을 알 수 있게 된다.
곡이 순위안에 들지 않았던 시점의 아이디들과 급작스럽게 올라가던 순간의 아이디들 그리고 순위에 안착되고 듣고 있는 아이디들의 생성 패턴을 확인하면 된다.
스팸 분석기법과 같은 방식을 이용하면 확률을 얻을 수 있을 것이다
아이디의 경우, 어뷰징일 가능성이 있는지 어뷰징 패턴 분석을 통해서 아이디별 어뷰징일 가능성을 확률로 뽑은 후, 아이디의 전체 집단의 확률을 모두 더한 후 N으로 나눠도 될 것이다. 연산 방식이야 많으니 데이터 분석가들 각자의 기량으로 분석을 해서 시간대별로 어뷰징 아이디일지를 유추하여, 확증은 없지만 어느정도 물증이 잡힐 정도의 증거를 1차로 확보한다.
신규 아이디와 오래된 아이디의 분류
어떤 곡들이 차트인을 할 때, 신규 아이디일지 오래된 아이디일지 곡들이 차트인한 순간의 아이디들의 라이프 타임을 분석해봐도 얼추 견적이 뽑힐 것이다.
그알에서보면, 2달 무료와 같은 이벤트로 아이디를 대량 생성하여 돌리는 모습이 나왔다. 이를 토대로 알 수 있는 것은 어뷰징 곡들의 경우, 차트인을 할 때 오래된 아이디로 차트인 시키지 않고 신규 아이디로 차트인을 시킨 가능성이 높다.
차트인을 했을 때의 아이디의 생성 시간과 현재 시간을 뺀 이후 모든 합을 더한 후 나누면 쉽게 알 수 있거나 생성시간 차의 편차가 적다면, 사재기일 가능성이 매우 높다. 그리고 만약에 해킹이 된 아이디로 차트인을 시킨거라면 더 쉬운 분석이 가능해진다.
해킹된 아이디의 경우
해킹이 된 케이스라면, 분명 VOC와 같은 문의가 많이 들어왔을 것이다. VOC 등 혹은 비밀번호를 급작스럽게 변경한 시기의 아이디를 분석하면 알 수 있을 것이다. 해커라면 해킹 이후 비번을 바꿨거나 혹은 해킹을 당했다는 사실을 안 실사용자가 비번을 바꿀 가능성이 높기 때문이다.
그런 아이디들을 모은 후, 해킹을 당한 아이디의 곡을 듣는 패턴을 분석하면 매우 쉬울 것이다.
모른다는 것은 말이 안된다
이와같이 멜론이 사재기를 모른다는 것은 말이 안된다. 분석이 어려운것도 아니고, 너무 쉽고 짧으면 하루 길어도 일주일이면 분석이 끝날 것이다. 결국 멜론이 알고 있지만 돈이 되서 막아두던가, 아니면 내부 관계자중 사재기에 관여된 사람이 있을 수 있는 것이다.
하루 빨리 멜론에 이번 사건으로 큰 타격을 입기를 진심으로 바란다. :) 그래야 이런 회사들이 정신을 차려서 국민들을 소,돼지,개로 보지 않고 박근혜를 하야시킨 사람들이라는 것을 기억해줬으면 한다.
'인공지능 및 데이터과학 > 인공지능 끄적끄적' 카테고리의 다른 글
4차 산업이 안왔다고? (0) | 2020.05.23 |
---|---|
VR로 다시 만난 딸, "너를 보았다"를 보며 기술의 발전 (0) | 2020.02.08 |
블라인드 채용과 A.I 면접관 (0) | 2018.10.25 |
Watson Personality Insight 그리고 SK의 Aibril(에이브릴) 넌 아웃!! (0) | 2017.09.12 |
컴퓨터가 되려는 인간과 인간이 되려는 컴퓨터 (0) | 2016.08.20 |