무료 TTS(Text to Speech) 프로그램 추천, Balabolka
- IT/IT 제품리뷰
- 2016. 10. 10.
자격증을 따거나, 혹은 영어공부를 하거나... 입시공부를 하거나...자투리 시간이 아까워서 수첩에다가 적기도 하고, 벽에다 붙이기도 하고, 포스트잇을 활용하기도 합니다. 저는 운동을 하면서, 공부를 할 수 없을까? 혹은 사람들이 너무나도 많이 있는 지하철에 스마트폰을 보지 않고 공부하는 방법이 없을까? 그리고 운전을 하면서 공부를 할 수 없을까? 라는 생각에 처음에는 녹음 프로그램을 이용해서 공부를 했었습니다.
녹음 프로그램이 가장 생생하고 가장 빨리 만들어 질 수 있습니다만, 제 목소리를 제가 듣는 것이 익숙하지는 않더군요. 그래서 활용한 것이 TTS였습니다.
TTS란, Text to Speech의 약자로서 말그대로 글자를 읽어주는 프로그램을 뜻합니다. 검색해본 TTS 프로그램들은 많은 텍스트를 읽지 못하였고, 사실 최강자라고 불리우는 TTS 프로그램인 '보이스웨어'라는 프로그램은 개인에게 팔지도 않더군요. 사실 가격이 맞으면 무조건 사고 싶은 프로그램이 보이스웨어입니다. 목소리 퀄리티가 다른 TTS와 상대가 되지 않습니다.
안드로이드에서 몇몇 TTS 프로그램이 있어서, 활용을 하곤 했지만 만드는 것이 여간 까다로운게 아니었습니다. 결국 PC버전을 검색하다가 이거 뭐지? 하면서 받은 프로그램이 바로 Balabolka 입니다.
제가 원한 조건은 아래와 같았습니다.
- 대용량의 텍스트를 읽을 수 있어야 한다.
- MP3나 WAV 형태의 음성파일로 생성되어야 한다.
- 목소리의 퀄리티가 높아야 한다.
무료 프로그램중에 혹시 있겠어? 라는 생각에 검색해 나갔습니다.
그 중에 찾은 것이 'Balabolka' 였습니다.
Balabolka는 기본적으로 MS에서 제공하는 '혜미'라는 목소리를 사용합니다. 즉 한마디로 MS에서 제공하는 TTS의 모듈을 사용한 프로그램이라는 것이죠. 문제는 이 혜미 목소리를 윈도우8 이상 버전부터 사용이 가능합니다. 제가 사용하는 컴퓨터가 회사컴은 윈도우7이고, 집컴은 윈도우10이라서 집에서는 혜미 목소리를 들을 수 있지만 회사 컴퓨터는 들을 수 없는 단점이 있었습니다.
그러나, 이러한 고민들을 해결해주는 또다른 기업의 무료 API가 있었으니 바로 구글에서 제공하는 TTS API입니다. Balabolka는 구글의 API를 호출해서 만들수 있는 기능도 제공합니다.
한마디로, 윈도우 7이하라도 인터넷만 되는 컴이라면 TTS로 변환 파일을 만들어 내는 대는 지장이 없습니다. MS와 구글은 역시 대기업답게 목소리의 퀄리티가 둘다 뛰어납니다. 각자 취향이 차이이니 윈도우 8이상의 사용자라면 취향대로 만드시면 됩니다.
http://www.cross-plus-a.com/kr/balabolka.htm
발라볼카 사이트에 들어가셔서, 다운로드를 받으시고 설치하시기 바랍니다. 설치가 완료되면 아래와 같은 화면이 보일겁니다.
일단 윈도우8이상자라면, 위와 같이 Microsoft Speech Platform(혜미 목소리)를 활용할 수 있습니다.
Rate, Pitch, Volume 등으로 목소리의 높낮이, 속도, 소리크기를 조절할 수 있습니다.
Default 목소리를 좀 무섭습니다. Pitch랑 Rate 등을 살짝 올리셔서 본인이 생각하기에 괜찮은 목소리로 변경하시는 걸 추천드립니다.
위에 설정을 적당히 변경하시고, Play 버튼을 클릭하여, TTS 변환 내용을 들어봅니다.
변환 내용이 마음에 들었다면, 이제 음성파일을 만들 차례입니다. File -> Save Audio File 을 선택합니다
위에 보이는 것처럼 단축키를 누르고 싶으시면 Ctrl + W를 누르시면 됩니다
파일 형식을 지정을 할 수 있습니다. 'MP3 Format Sound'를 선택합니다. 본인에 맞는 파일 형식을 사용하세요. 뭐가 뭔지 잘 모르신다면, MP3를 선택하세요.
선택을 하고, 저장을 클릭하여 파일을 생성합니다.
여기서 윈도우7이하의 분들은 아마 파일이 안 만들어질 거에요..ㅠㅠ
자 이제부터, 구글 TTS를 활용하는 방법을 설명하겠습니다.
Tools -> Save Audio File (Google TTS)를 선택합니다.
그러면, 심플한 모습의 입력창이 하나 뜰겁니다.
위와 같이, Language를 한국어(대한민국)으로 설정하고, Browse를 선택하여 저장할 위치와 파일 포맷을 선택합니다.
파일 형식은 아까처럼 MP3로 선택을 하겠습니다(잘 모르시면 MP3로 하시면 됩니다)
선택 후, 저장을 누릅니다.
마지막으로, Save 버튼을 누르면 버튼이 Stop으로 변경이 되며 우측 화면에 progress bar가 뜨면서 파일을 생성합니다.
해당 위치로 가시면, 위와 같이 파일이 만들어진 것을 확인하실 수 있습니다.
참고로, TTS를 작성하기 위한 팁
1. 영문은 되도록이면, 한글로 변경하세요.
ex) Apple -> 애플
아무래도 한국어 TTS다보니, 영문 인식률이 좋지 못하고, 제가 원하는 말을 안할때가 있습니다.
2. 약어는 점을 붙여줍니다.
ex) UFC -> U.F.C
가끔씩 합쳐서 읽을 때가 있습니다. 점을 넣어주면, 확실히 한글자씩 읽습니다.
3. 원하는 시간에 텀을 주고 싶을 경우
그냥 마구잡이로 글을 쓰면, TTS가 쉬지 않고 말을 하기 때문에 듣는 입장에서도 힘이 들때가 있습니다. 중간 중간 쉼표, 마침표 등을 활용하여, 잠깐 쉬는 타임을 유도합니다.
쓰면 쓸수록 노하우가 늘어납니다. 처음에는 여러번의 시행착오를 수행하지만, 점점 노하우가 늘면서 나중에는 한번에 텍스트를 쭈욱 뽑아놓고 한번에 녹음 파일을 만드는 경지에 오르게 됩니다 ㅎㅎ
윈도우 8이상인데 혜미(MS)를 쓸까요? 구글을 쓸까요? 라는 질문에 대한 답변
MS(혜미)
목소리의 높낮이, 속도등을 조절할 수가 있습니다. 단어를 딱딱 말하며, 쉼표등을 활용하면서 말할 경우 정확한 발음으로 말을 합니다. 단지, 기계같은 느낌이 종종 있어서 어떤 단어를 외울 때는 유리하나 문장을 읽을 경우 불리할 수 있습니다. (추천: 단어 외우기)
구글
정말 사람이 말하는 것처럼 말을 해줍니다. 단점은 졸릴 수(사람 차이일 수 있지만...) 있고, 목소리의 높낮이 속도등을 조절할 수 없습니다. 혜미보다 좀 천천히 말합니다. 그리고 인터넷으로 구글 API를 활용하다보니 파일 생성이 좀 느릴 수 있습니다. 장점은 위에 있는 것을 무시할 정도로 목소리에 대한 거부감이 없습니다. 단지 약어(ex: U.F.C) 같은 경우는 혜미보다 읽는 것이 좀 떨어집니다만 한글은 보이스웨어 수준으로 퀄리티가 뛰어납니다.
저는 똑같은 내용을 구글과 MS 목소리 둘다 변경하고 둘다 듣습니다. 어차피 한번 들을려고 만드는 것도 아니고, 각자의 장점이 있다보니 처음에는 구글 목소리를 먼저 듣고, 그 다음에 혜미 목소리를 듣습니다. 하나의 목소리만 계속 듣는것도 스트레스가 있을 수 있습니다.
한번도 TTS를 사용해본적이 없으신 분들은 자격증 시험때나 외워야 될 요약집 등을 TTS로 만들어서 들어보시면, TTS의 위력이 얼마나 훌륭한지 아실 수 있을 겁니다.
'IT > IT 제품리뷰' 카테고리의 다른 글
인공지능 스피커 SKT "누구(Nugu)" 사용후기 (0) | 2017.09.11 |
---|---|
로지텍(Logitech) 무소음 무선마우스 M331 사용후기 (1) | 2016.11.05 |
앱스토어, 아이폰, 애플워치 조깅/걷기 앱 추천 Pacer (0) | 2016.09.23 |
아이폰(앱스토어), 공부시간 체크앱 aTimeLogger(타임로거) 추천 (0) | 2016.09.15 |
직장인 가방, 인케이스 노트북 15형 시티 컴팩트 백팩 후기 (0) | 2016.08.29 |