사실 보컬로이드가 인간에 가깝게 노래하는지에 대해 ‘자연스러움/부자연스러움’을 써야할지 아니면 ‘인간적인/비인간적인’이란 말을 써야할지 혼란스러운 게 사실이다. 다만 여기서는 보컬로이드 판매 사이트에서 보통 ‘자연스러운 노래’ 같은 표현이 쓰인다는 점을 참고해 ‘자연스러움’으로 표현했다. 

다른 가상악기와 비교

보컬로이드에는 항상 자연스러움에 대한 문제가 따라다닌다. 여기서 자연스러움이란 발음, 음색 등이 얼마나 인간과 가깝게 자연스럽게 표현되느냐에 대한 것이다.

피아노 가상악기를 잘 다루는 사람이 만든 곡은 실제 악기인지 아닌지 알아차리기가 힘들다. 하지만 보컬로이드를 자연스럽게 잘 다루는 사람이 만든 곡은 실제 가수가 부른 것인지 아닌지 알아차리기 쉽다. 이러한 자연스러움에 대한 문제는 보컬 가상악기인 심포닉 콰이어스와 비교에서도 나타난다. 이러한 이유는 무엇일까.

1. 악기가 아닌 보컬 가상악기이다. 인간의 목소리를 구현한 것이기 때문에, 기타나 피아노같은 악기에 비해서 인간인 청자들은 보다 민감하게 느낀다.

2. 한 명만의 보컬을 가상악기로 구현한 것이다. 오케스트라 가상악기들은 이미 상업음악 시장에 진출하여 많은 곳에서 쓰이고 있다. 하지만 솔로로 사용될 경우에는 이야기가 다르다. 20개의 바이올린을 샘플링하여 곡에 사용하는 경우와, 한 개의 바이올린을 샘플링하여 곡에 사용하는 경우는 차이가 크게 난다. 보컬 가상악기도 마찬가지이다. 여러명의 목소리이기 때문에 하나 하나의 자연스러움을 찾아내기 힘들기 때문이다.

3. 맞는 입력 장치가 없다. 가상악기를 연주할 때 최대한 자연스럽게 만드는 방법으로는 해당 악기에 맞는 입력장치를 쓰는 방법이 있다. 기타 가상악기를 연주할 때는 USB 기타를 쓰면 되고, 색소폰 가상악기를 연주할 때는 윈드 컨트롤러(Wind Controller)를 쓰면 된다.


아카이(Akai)의 윈드 컨트롤러 EWI 4000S

하지만 보컬 가상악기에는 마땅한 입력장치가 없다. 타자를 치고, 미디 키보드로 연주하고, 마우스로 만져주는 등의 과정을 거쳐야 한다. 이것은 매우 성가실뿐더러, 다른 가상악기에 비해 자연스러움을 표현하기 어렵게 만든다. 안 그래도 보컬 가상악기라서 자연스러움을 표현하기 힘든데, 입력장치까지 없는 것이다. 물론 목소리를 미디로 바꾸는 방법들도 존재하지만, 아직까지는 부족한 수준. 게다가 그 방법으로는 음의 높낮이, 지속시간, 소리 크기 정도나 입력할 수 있다. 가장 중요한 부분인 발음은 입력이 불가능하다.

보컬로이드안에서의 비교

어떤 보컬로이드는 자연스럽고 어떤 보컬로이드는 부자연스럽다. 또한 같은 보컬로이드라고 해도 사용자의 실력에 따라서 자연스러운 보컬이 나올 수도 있고, 그렇지 않을 수도 있다. 미디를 이용하여 작곡하는데 매우 능숙한 사람도 보컬로이드를 잘 다루지 못 한다면 매우 부자연스러운 목소리를 내는 곡이 나올 것이다.

물론 사용자의 보컬로이드 실력과는 상관없이, 방향성을 자연스러움과 정 반대로 추구할 수도 있다. 대표적인 경우가 하츠네 미쿠의 대표적인 히트곡 중 하나인 “하츠네 미쿠의 소실”. 보컬로이드에 대한 찬가라고 할 수 있는 이 곡은, 보컬을 의도적으로 인공적인 방향으로 표현하여 인기를 끌었다.


“하츠네 미쿠의 소실”은 금영노래방에도 수록된 곡이다

“하츠네 미쿠의 소실”에서 보듯 보컬로이드 곡이 히트하기 위해서는 보컬로이드를 자연스럽게 다루는 능력은 그리 중요하지가 않다. 곡 쓰는 능력과 해당 보컬로이드만의 개성과 가능성을 잘 살리는 것이 더 중요하다는 것이다.

보컬로이드가 사용된 곡에서의 자연스러움이 차지하는 비율은, 대중가요에서 가창력이 차지하는 비율과 비슷할 것이다. 부자연스러워도 전혀 신경 쓰지 않는 사람도 있으나, 상당수의 사람들은 일정 이상의 자연스러움을 기대하고 있을 것이다. 이것은 보컬로이드에 익숙하지 않은 사람일수록 크다. 최근 TV 데뷔로 관심을 받은 시유의 경우만 봐도 그렇다. 보컬로이드에 익숙하지 않은 사람들은 억양이나 음색까지 갈 것도 없이, 시유의 부자연스러운 발음부터 듣기 싫어하는 경우가 많았다. 이러한 이유들로 인해서, 적어도 지금 기술력으로는 인간 가수와 동일한 수준에서 평가받는 것이 불가능한 것이다.

얼마나 자연스러운가

상당수의 음악가들은 어쿠스틱 악기를 흉내내거나 샘플링한 음색을 사용할 때, 아주 똑같지 않으면 실제 음색과 거리가 멀어도 좋으니 차라리 개성이 있기를 바란다. 어설픈 것을 싫어하는 것이다. 때문에 아날로그 신디사이저로 합성된 금관악기 소리를 윈도우에 있는 마이크로소프트 GS 웨이브테이블 소프트웨어 신스(Microsoft GS Wavetable SW Synth)의 금관악기들 보다 더 좋아하는 사람이 많다. 후자가 더 실제 악기에 가까운 소리를 내지만, 후자의 경우 “미디 느낌이 난다.” 혹은 “어설프다.”라고 느끼는 경우가 많기 때문이다. 이러한 이유로 보컬로이드가 인간과 거의 같은 목소리를 내지 못한다면, 차라리 매우 특이한 목소리를 내는 편이 음악가들에게 매력으로 다가올 수도 있다.


국산 보컬로이드라고 할 수 있는 보카리나(Vocalina)의 카일린(KHylin)
보카리나는 야마하의 보컬로이드와 관계없이 자체 프로그램을 사용한다

전자음악가들은 오래 전부터 비인간적인 목소리에 대한 관심이 컸다. 멀게는 보코더(Vocoder)가 있고, 가깝게는 오토튠(Auto-Tune)이 있다. 그런데 보컬로이드는 그러한 비인간적인 음색을 표현하기에는 너무 인간적이다. 비인간적인 음색을 원하는 음악가들에게도 보컬로이드는 매력이 떨어지는 것이다. 물론 보컬로이드도 고의적으로 권장 음역을 넘어서게 만들거나, 속도를 빠르게 하는 등의 방식으로 인간과 거리가 있는 음색을 만드는 것이 가능하긴 하다. 하지만 비인간적인 음색을 원한다면 차라리 제트스피치(JetSpeech), 쉿-토커(Shit-Talker)류의 프로그램으로 목소리를 만들고 오토튠으로 만져주는 편이 더 효율적일 것이다. 이러한 이유들로 오타쿠 문화 밖의 음악가들은 보컬로이드에 별 관심을 보이지 않고 있다. 물론 자신의 작품에 오타쿠 냄새를 내기 싫어서이기도 하겠지만 말이다. | 고두익 [email protected]

One Response

  1. mimyo

    하츠네 미쿠의 소실은 꽤나 강하군요. 콧소리 같은 피치쉬프트가 특징이라는 정도의 인상만 있었는데, 굉장히 흥미롭게 잘 들었습니다. 다양한 가능성이 있어 보이는데, 한동안은 아니메 컬쳐 밖으로 나가기 보다는 안에서 더 깊어지지 않을까 생각하니 그것 또한 재밌네요..

    응답

Leave a Reply

Your email address will not be published.