유튜브(Youtube) 추천 사례 - Zero to 추천시스템

    이전 포스팅에서는 넷플릭스(Netflix)에 대해서 알아보았다. 다만 많은 추천(Recommendation)을 연구하는 연구원과 다르게 일반 사용자들 특히 대한민국 국민들은 넷플릭스를 추천의 대명사처럼 생각하지는 않을 것이다. 왜냐하면 우리가 추천이라는 것을 별도로 인지하기 힘이 들며, 넷플릭스 추천의 경우 잘 만든 큐레이션 처럼 생각할 수 있기 때문이다. 

     

    그에 반해 한국 국민들은 유튜브의 추천 알고리즘을 긍정적이고 핫하게 생각하는 경우가 많다. "알 수 없는 유튜브의 추천 알고리즘이 나를 여기로 이끌었다"[1]와 같은 댓글처럼 유튜브의 추천 알고리즘은 많은 사용자들에게 매우 신기하고 경이로운 영역이며 사람들이 인공지능(AI)을 긍정적으로 평가할 수 있는 요소로 자리잡기도 했다.

     

    유튜브(Youtube) 추천 사례 - Zero to 추천시스템


    브레이브 걸스 역주행 사례

    유튜브의 추천 알고리즘의 대표적인 사례로 걸그룹인 브레이브 걸스(Brave Girls)를 해체 위기에서 구해내며, 역주행을 시켰다는 점이다.

     

    댓글을 편집하여 재미있는 영상을 올리는 어느 유튜버는 브레이브 걸스 영상을 올렸는데 이 영상이 매우 잘 만들어 지면서 유튜브를 보는 사람이라면, 어느새 자신의 추천 목록에 처음 들어보거나 익숙하지 않는 브레이브 걸스의 영상이 올라오게 되었으며 나도 모르게 클릭을 하여 영상을 보면서 영상의 인기는 기하급수적으로 터지게 되었다.

     

    브레이브 걸스의 역주행 영상

     

    유튜브의 어떤 알고리즘으로 브레이브 걸스의 영상이 우리에게 추천이 되었는지 모르겠으나, 해체 직전의 걸그룹을 대세 걸그룹으로 만들어준 추천 알고리즘은 다시 한번 추천이 얼마나 위대한지 알게한 사례가 되었다. 그리고 사실 이런 케이스는 유튜브의 인기 영상들은 모두 해당이 되기에 브레이브 걸스만 따질 필요 없으며, 유튜브의 추천 방식 자체가 추천을 처음 접하는 연구원들에게는 흥미로운 영역일 것이다.

     

     

    유튜브의 추천 알고리즘

    사실 브레이브 걸스 추천 사례는 유튜브의 알고리즘이 대단하다고 말하기에는 부족한 면이 있다. 왜냐하면 최근에 올라온 영상 중 조회수 대비 좋아요가 매우 높으며, 사람들이 끝까지 시청을 했는지(영상에 만족하는지) 등을 분석하다보면 충분히 영상이 남들에게 추천이 될 수 있기 때문이다.

     

    게다가 협업 필터링(Collaborative Filtering, CF)과 같은 보편적인 알고리즘을 써도 브레이브걸스의 영상은 충분히 나타날 수 있기 때문에 브레이브 걸스의 사례는 어찌보면 플랫폼의 위대함이라 볼 수 있지 유튜브의 추천이 대단하다 말을 할 수 없다.

     

    무한도전을 봤을 때의 추천 리스트

     

    위 캡쳐 이미지는 무한도전 영상을 선택한 후 나오는 추천인데 우측의 추천 리스트를 보면, 최상단은 현재 영상과 가장 연관이 깊은 영상이 나오며, 그외 나오는 것들은 내가 구독한 채널들과 전에 검색하거나 봤던 영상들이거나 유사한 영상들이 섞여서 나온다.

     

    즉 유튜브의 추천 리스트는 사실 편집이 다를 뿐이지 우리가 대단하다 느껴질만한 기술을 보여주지 않는다는 것이다. 다만 사용자들이 어떻게 하면 영상을 연속으로 볼 것인지 컨텐츠를 잘 배분하는 기술이 매우 정교하게 되어 있는 것으로 볼 수 있다.

     

    유튜브는 이렇게 추천 리스트의 행동을 분석하고 학습하여, 사용자가 추천의 미로에 벗어나지 못하도록 만들고 있는데 넷플릭스와 유사하게 유튜브 역시 컨텐츠의 소비 중 70%가 추천 알고리즘으로 이뤄진다고 알려져 있다.[2]

    유튜브의 영상 추천

    이렇게 말하자면 유튜브의 추천 알고리즘은 특이한 점이 없는가 싶을 수 있지만, 인공지능에 가장 최선봉에 서는 일류 기업으로 구글은 자신들만의 강점인 알고리즘을 만들어 냈다.

     

    바로 영상 컨텐츠를 기반으로 하는 추천이다. 넷플릭스는 영상을 본인들이 올리며 검수까지 진행한다. 즉 다른 서비스와 다르게 추천을 위해서 다양한 기능들을 직접 넣을 수 있는 것이다. 대표적으로 퀀텀 이론(Quantum Theory)[3]이라는 더이상 쪼개지기 힘든 장르를 자체적으로 만드는 것과 컨텐츠의 내용과 출연진, 제작진들을 데이터베이스에 맞게 올바르게 넣어서 컨텐츠 기반의 추천을 잘 만들 수 있다.

     

     

    이에 반해 유튜브는 넷플릭스와 다르게 데이터의 퀄리티를 높일 수가 없다. 사람들이 올린 영상과 컨텐츠의 일치 여부 등으로 어느정도 식별할 수 있겠지만, 모든 사람들이 영상에 텍스트 컨텐츠를 잘 적는것도 아니고, 넷플릭스와 다르게 매우 불리한 위치에 서 있다.

     

    유튜브는 이런 불리한 점들을 영상 분석에서 커버 하는데 영상에 있는 사람들을 감지하고 분류하는 기능등을 이용하여 어떤 사람들이 출연했는지 알 수 있으며, 동일한 사람이 나온 영상이나 같은 동물(개나 고양이 등)이 나온 영상들을 추천하게 된다.

     

    그리고 STT(Speech To Text) 기능을 활용하여, 영상에 나오는 소리를 자막으로 만들어내고 이 자막을 이용해서 내부적으로 토픽이 유사한 컨텐츠를 찾아낼 수 있다. 넷플릭스는 이 모든 것들을 컨텐츠로 등록할 때 직접 만들기에 불필요하지만, 유튜브는 불리한 추천 시스템에서 살아남기 위해서 동영상 분석 기법을 고안해낸 것이다.

     

    이준석 교수의 유튜브 알고리즘, 커리 큘럼

     

    참고로 유튜브가 영상의 이미지와 소리를 이용해서 추천을 한다라는 설명을 국내 뉴스나 저널 등에서는 찾을 수 없었으나, 최근 패스트 캠퍼스(Fast Campus)에서 유튜브의 추천 시스템을 담당하는 이준석 서울대학교 교수의 강의 설명에 의하면 유튜브는 동영상을 분석해서 추천에 활용하는 것이 맞는 것으로 보인다.[4]

     

    참고자료

    [1] 나무위키 - 유튜브 알고리즘

    [2] https://qz.com/1178125/youtubes-recommendations-drive-70-of-what-we-watch/

    [3] 넷플릭스(Netflix) 추천 사례 - Zero to 추천시스템

    [4] https://fastcampus.co.kr/data_red_ljs?utm_source=google&utm_medium=social&utm_campaign=prd%5E211122%5E206848&utm_content=banner%5E4_2%5E206848&gclid=EAIaIQobChMI85C749Xv9AIVgrK9Ch2jbQgNEAEYASAAEgLVO_D_BwE

     

     

    댓글

    Designed by JB FACTORY