Fight Test/단상

비디오 게임의 효과음은 어떻게 게임 속 가상의 육체와 상호작용하는가?

giantroot2023. 1. 7. 23:13

하스미 시게히코의 허구와 '재현 불가능한 것': 모든 영화는 무성영화의 변주에 불과하다라는 영화 음향에 대해 급진적인 주장을 한다. 하스미는 이 글에서 유성 영화의 도래 이후로도 영화의 기본 형태와 진행 방식은 무성영화에 머물러 있으며, 영상과 음향은 최근까지도 분리되어 진화했다고 주장한다. 이 주장에 대한 논거로 그는 유성 영화 기술이 발명된 이후로도 슬레이트 및 녹음 같은 도구들을 인공적인 사후 녹음 및 동기화를 거쳐야 한다는 점을 지적한다. 하스미 시게히코는 영화 제작 현장에서 녹음은 촬영보다 뒷순위에 있었다고 지적하면서 21세기 들어 촬영과 녹음이 동시에 가능한 디지털 자기 테이프가 들어서야 이 장벽이 낮아지고 새로운 방법론이 등장했지만, 그럼에도 하스미는 영화가 시청각예술이라는 개념을 적극적으로 배격하려고 한다.

 

이 급진적인 글은 지금 시점에서는 재고할 여지가 있긴 하다. 과연 이런 촬영과 녹음의 비 동시성이 현대 영화의 정체성을 무성영화의 변주로 한정해서 말할 수 있는지부터 시작해, 20019.11 테러 당시 영상이 가지고 있는 무성 영화적인 순간을 지적하지만, 2000년대 말에야 등장한 스마트폰 카메라의 디지털 촬영/녹음의 동시성과 편의성이 불러온 파급 효과에 대한 분석의 부재가 그렇다. 하지만 이런 재고와 별개로, 하스미 시게히코의 글에서 주목할만한 흥미로운 지적이 있다. 바로 음성 녹음에 대한 기술적인 어려움이 있었다는 사실과 목소리가 육체와 동일시될 수 있다는 주장이다. 하스미는 프랑스 시인 스테판 말라르메의 사진은 남아있어도, 그의 목소리가 어땠는지를 알려줄 음성 기록은 없다고 지적한다. 그러면서 목소리를 재현한다는 것은 육체성을 상실함을 암시하며 음성 재생 기술의 보급과 음성 녹음 기술의 보급은 서로 다른 영역의 이야기라고 보았다. 하스미는 이런 추론을 정리하면서 필름이라는 매체가 소리라는 요소를 억압했을지도 모른다는 관점을 취한다.

 

여기서 하스미가 음향은 이미 인공적 효과를 강조하면서 가상 현실을 만들어냈다라고 서술한 부분과 더불어 촬영과 녹음의 동시화의 발전에 대해 21세기 디지털 기술을 언급하고 있다는 점은 눈여겨볼 필요가 있다. 왜냐하면 비디오 게임은 철저히 디지털 기술에서 탄생한 매체이기 때문이다. 우선 비디오 게임의 핵심이라 할 수 있는 시각 요소는 명백히 프로그래밍 코드에 기반한 디지털 데이터에 기반하고 있다. 사진술과 시간의 조합과 배치로 허구의 내러티브를 창조한 영화의 방법론을 빌릴 뿐, 비디오 게임에 등장하는 모든 시각 요소들은 01의 기초해 인공적으로 생성manipulate된 무언가다. 그럼에도 비디오 게임의 시각 요소는 (하룬 파로키가 평행연작 작업을 통해 지적했듯이) 플레이어에게 매우 실제적인 경험과 영향을 안기고 있다. 그렇기에 비디오 게임의 주류화는 디지털 이행기에 영화가 마주해야 했던 디지털 영화의 새로운 가능성과 정체성 논쟁하고 맞물려 있다. 비디오 게임의 등장은 물질 매체에 기반한 기록을 벗어나, 인공적인 코드와 데이터로 생성된 시각 요소, 나아가 상호 작용하는 허구적 내러티브가 가능해졌다는 걸 보여주는 사례기 때문이다.

 

여러 시행착오를 거쳐 게임 음향 기술이 안정화된 2020년대 기준으로 게임 음향 제작이나 구현은 영화 음향하고 크게 다르지 않은 상태다: 게임 제작자들은 음향 기술자들과 함께 녹음 스튜디오에서 다양한 효과음과 배경음을 녹음하고 게임 유저들은 스피커나 이어폰 같은, 디지털화된 파형을 물리적으로 구현하는 도구를 쓴다. 하지만 영화 음향과 달리, 게임 음향은 상호작용이라는 요소가 개입하면서 영화와 차별화되는 활용 방법을 만들어내고 있다.

 

이런 차별점을 파악하기 위해 최문기, 조성호, 김수진, 정재범, 이현우의 2010년 논문 게임의 음향 요소가 플레이 중 사용자의 스트레스에 미치는 영향논문을 인용하고자 한다. 이 논문의 정의에 따르면 게임 음향은 배경음악과 효과음으로 분류할 수 있다. 전자는 영화 사운드트랙랑 마찬가지로 일방적으로 구현되는 음악을 지칭한다면, 후자는 게임 사용자의 조작에 대한 상호작용 음향이나 환경음을 지칭하고 있다. 해당 논문이 주목하는 지점은 후자인데, 비디오 게임이 음향 요소 중 효과음을 시각 요소와 피드백하는 형식으로 게임의 상호작용을 구현한다고 보기 때문이다.

 

본 논문 저자들은 선행 연구 조사를 통해 음향이 게임 수행이라는 게임의 핵심적 요소에 큰 영향을 미치지 않지만 음향 요소, 게임 수행과 시각 요소 사이에는 복잡한 상호작용이 존재한다라고 보았다. 다만 동시에 이런 선행 연구에서 배경음악과 효과음이 명확하게 분리되지 않은 채 실험이 진행되었다고 지적하면서, 배경음악 효과음과 배경음악을 철저히 분리해 효과음을 독립 변인을 설정한 실험을 새로 진행했다: 한쪽 실험군에 효과음을 제거한 게임을 플레이하게 하고, 효과음이 있는 게임을 한 다른 실험군과 비교하게 한 것이다. 실험 결과 이들은 효과음이 게임 플레이의 직접적인 스트레스 원인은 아니긴 하지만 별개로 긴장감을 만들어내고 이 긴장감이 몰입 요소에 영향을 미친다는 결과를 도출했다.

 

다시 하스미 시게히코의 논의로 돌아가자면, 하스미는 영화 음향의 딜레마는 소리=음향과 영상을 통합하는 방식에서 긴 시간 동안 고충을 겪었다는 점에서 비롯되었다고 보고 있다. 영화에서 시각 요소와 음향 요소는 오랫동안 분리되어 기록해 합쳐져 왔고, 그렇기에 하스미는 영화가 본질적으로 시각 언어로만 발전해온 예술이었다는 주장을 펼쳤다. 하지만 비디오 게임의 음향은 (정확히는 가상의 환경-이미지와 육체-이미지를 구성하는 효과음) 영화가 겪었던 시각과 청각 간의 반목과 분리에서 어느 정도 거리를 두고 있다. 물론 상술한 논문에서도 언급했듯이 비디오 게임의 음향이 본질적인 게임 수행 (플레이)에 영향을 미친다고 볼 수 없을 것이다. 그러나 비디오 게임은 시각 요소가 아닌 상호 작용이 중심인 매체다. 어느 정도 통합해야 할 방향성이 제시된 셈이다. 즉 오랫동안 핵심을 차지한 카메라-시각 언어에 따라와야 했던 영화의 음향 언어랑 달리, 비디오 게임은 시각과 음향 언어가 상호작용이라는 목표에 보좌하고 몰입하게 만드는 도구라는 방식을 취했기 때문에 새로운 영역과 방법론을 개척할 수 있었다.

 

비디오 게임 음향 기술이 발전하던 1990년대부터 이런 효과음을 상호작용의 도구이자 플레이어를 몰입하게 만드는 연출이 본격적으로 구현되기 시작한다. 최초의 리듬 액션 게임으로 샘플링 기법과 프리 스타일 래핑을 버튼 조작과 게임 플레이를 결합한 파라파 더 래퍼’, 투명한 괴물을 내세워 시각 요소를 최소화하고 벨소리 개념을 통해 괴물의 위치를 파악하고 공격해야 하는 이이노 켄지의 1996년작 에너미 제로’, 혁신적인 조명 시스템과 더불어 캐릭터가 내는 소음이나 환경음 같은 복잡한 음향 환경을 통해 은신 정도를 판별하고 진행해야 했던 1998시프: 더 다크 프로젝트가 대표적일 것이다. 언급한 게임들은 효과음은 단순히 효과음에 그치지 않고 게임 수행의 도구이자 몰입용으로 쓰인다. 이 세 게임에서 음향, 특히 효과음이 실제 게임 디자인에 간섭한다고 볼 수 없을 것이다. 심지어 파라파 더 래퍼역시 음향 없이도 게임 도중 상단에 뜨는 버튼을 순서대로 누르면 진행할 수 있다. 하지만 음향이 없었다면 전혀 다른 인상을 줬음은 자명하다.

 

현대 비디오 게임의 효과음 연출은 다소 편중된 경향을 보이는데, 주로 리듬 액션 게임이나 액션, 어드벤처 게임에서 음향을 적극적으로 활용하는 편이다. 그럼에도 몇몇 게임 개발자들은 영화랑 다른 방식으로 시각 언어와 창의적으로 연계해 상호작용, 나아가 몰입감을 만들어냈다. 우선 언어의 디테일을 대폭 축소해 무성 영화식 유머에 기반해 재해석한 부류가 있다. 대표적인 예시로는 심즈시리즈가 있다. 전지적인 시점에서 진행되는 시뮬레이션 게임인 만큼 효과음과 가상의 신체, 플레이어의 조작이 긴밀하게 연결된다고 보기는 힘들지만, 이 시리즈가 대화를 연출하는 방식은 흥미롭다. 게임 속 심즈들이 벌이는 대화를 가상의 언어 심리시로 추상화하고 심 머리 위에 뜬 주제 아이콘이 담긴 말풍선과 엮는 방식을 취했기 때문이다. ‘심즈시리즈는 이런 연출을 통해 게임 속 가상의 육체와 그 육체를 재현하고 있는 목소리가 허구라는 걸 인정한다. 그리고 그 허구의 육체와 재현된 목소리를 실제 언어와는 거리가 먼 추상적인 도상들로 재구성한 후 코미디 도구 삼아 인물들의 상황과 상호작용을 함축적으로 표현하고 있다.

 

액션/어드벤처 게임에서도 이런 시도를 찾아볼 수 있다. 2019년에 발매된 언타이틀드 구스 게임은 심즈 시리즈와 유사하게 추상화된 효과음과 언어 요소의 축소로 느긋하고 코믹한 분위기를 만들어내는 게임이다. 이 게임의 주인공은 거위인데다 인간 캐릭터들에게도 목소리가 없다. 인간 캐릭터의 생각 역시 심즈 시리즈가 그랬듯이 픽토그램이 담긴 말풍선으로 표현된다. 대신 플레이어는 행동 말고도 거위 울음소리를 낼 수 있는데, 이 울음소리를 통해 인간들의 주의를 끌거나 겁을 줄 수 있다. 잠입 액션 게임 장르에서 볼 수 있는 소음으로 적 관심 끌기를 희극적으로 변주하고 있는 셈이다. 그렇기에 배경음악 이외 게임 전반을 지배하는 음향은 다름 아닌 플레이어가 상호작용하기 위해 내는 거위 울음소리다. 명확한 거위 여기다 피아노로만 이뤄져 상황에 따라 완급이 이뤄지는 배경음악이 곁들어지면 전원적인 무성 슬랩스틱 코미디가 탄생한다. 그 점에서 언타이틀드 구스 게임은 자크 타티 영화들이 그랬듯이 세심한 효과음 배치를 통해 유성의 상태에서 무성 코미디의 감각을 재현하려는 코미디 게임이다.

 

반대로 불편하게 자극하는 방식으로 가상의 육체-이미지와 효과음을 결합하는 비디오 게임도 있다. 주로 심리 호러 게임에서 찾을 수 있는 방법론인데, 이런 방법론을 인상적으로 펼친 게임으로 ‘Auti-Sim’헬블레이드: 세누아의 희생이 있다. 먼저 ‘Auti-Sim’은 청각 과민성 자폐 질환을 재현한 게임이다. 1인칭 시점에서 진행되는 이 게임은, 사전 정보 없이 진행했다가 놀랄지도 모른다. 아이들에게 다가가면 작게 들렸던 잡음들이 커지면서 비명이 크게 울려 퍼지기 때문이다. 동시에 화면은 잡신호가 끼면서 타자와 환경의 이미지를 재현하지 못하게 된다. 이걸 피하기 위해서는 다시 구석으로 돌아가거나, 아예 게임을 꺼야 한다. 이때 플레이어의 조작과 청각적 반응은 청각 과민성 자폐 질환 환자의 육체와 동일시된다. ‘Auti-Sim’이 광의적인 의미의 공포 게임이라 할 수 있다면, 온전치 못한 1인칭 육체가 사회랑 마주하면서 겪어야 하는 끔찍한 효과음을 피하기 위해서는 도피밖에 없으며, 그 고통스러운 순환 구조가 장애 아동의 힘든 현실과 연결된다는 점이다.

 

헬블레이드: 세누아의 희생‘Auti-Sim’의 효과음 연출을 좀 더 명시적인 내러티브와 어드벤처 게임 플레이랑 연계하고 있는 게임이다. 일견 중세 북유럽 설화 기반한 언차티드풍 액션 어드벤처처럼 보이는 이 게임은, 실상은 사랑하는 사람을 잃고 고통받는 정신병 환자의 내면을 지독하게 파고든다. ‘Auti-Sim’이 그랬듯이 헬블레이드: 세누아의 희생은 환청이라는 효과음을 게임 전면에 깔고 들어간다. 세누아는 조현병 환자이며, 게임 내내 작중 상황에 대한 독백부터 시작해 게임 플레이에 대한 정보까지 다양한 환청을 계속 듣는다. 이 환청은 종종 시각적 퍼즐 도구인 환각과 결합하기도 한다. ‘헬블레이드에서 환청은 게임 수행에 도움을 주는 도구이기도 하지만, 삼인칭으로 제시되는 세누아가 겪어야 하는 정신적/육체적 고통과 플레이어 사이를 상호작용하는 매개체이기도 하다. 이를 도구이자 매개체로서 환청을 구현하기 위해 제작진은 환청 전문가와 실제 환청 환자들을 기용했으며, 360도 지향성 마이크로 녹음하면서 마이크와 세누아의 가상의 육체 이미지랑 동일시하는 녹음 연출을 도입하고 있다.

 

이 두 게임 모두 정신병 환자의 시점에서 진행되며 장르적으로는 워킹 시뮬레이터에 가깝다는 점을 주목할 필요가 있다. 두 게임은 플레이어 캐릭터의 온전하지 못한 정신을 재현하기 위해 환청 및 소음을 게임 내 효과음으로 편입한 뒤, 프로그래밍으로 구성된 시각 이미지 위에 겹겹이 배치해 주인공 캐릭터와 캐릭터 밖 상호작용들과 결합한다. 그리고 플레이어가 이들의 육체를 조작하면 환청의 강도를 강하게 만드는 방식으로 화면 밖 플레이어의 감각과 고통스럽게 자극한다. 어찌 보면 언급한 사례 중에서는 가상의 육체 이미지를 강하게 의식하는 연출이라 할 수 있는데, 두 게임에서 상호작용이라는 틀은 가상의 육체랑 동일시되며, 청각 언어와 시각 언어 모두 환자로 설정된 가상의 육체가 겪는 경험을 직접적으로 반영하기 때문이다. 환청/소음 효과음이 주인공의 육체 속에 잠재한 정신병을 서술하고, 가상의 육체와 플레이어 간의 상호작용의 도구로서 기능하고 있는 셈이다.

 

음향은 시각 중심 매체에서는 부차적인 도구일지도 모른다. 청각 언어는 시각 언어와 달리 지극히 비가시적인 방식으로 진행되며, 재현 과정 자체가 오랫동안 까다로웠다. 하스미 시게히코가 자신의 글에 유성 영화라는 개념을 부정하려고 했던 이유는, 비가시적이며 일종의 가상 현실을 구축하며 영화 음향이 카메라로 기록된 가시적인 이미지를 하나로 묶어서 구축하는 게 어려운 일이며, 그렇기에 오랫동안 분리되어 발전해왔다는 사실을 지적하기 위해서였다.

 

디지털 시대에 등장한 비디오 게임의 시각 언어와 청각 언어가 진정한 의미로 한 몸처럼 동기화되어 있는가? 는 여전히 논쟁의 여지가 있다. 하지만 비디오 게임은 자신이 인공적인 생성에 기반해 있다는 사실을 처음부터 인정한다. 그 인정 위에서 비디오 게임의 시각 언어와 청각 언어는 게임 수행이라는 목표에 도달하기 위한 도구로 봉사하고, 몰입감을 만들어낸다. 이런 과정 속에서 비디오 게임의 음향 연출은 영화랑 다른 명확한 개성을 만들어내고, 게임 속 가상의 육체의 상태나 감정을 상호작용하는 방법을 발명하고 있다. 그 점에서 비디오 게임의 음향 연출은 시각 매체가 음향을 다루는 방식에 대해 새로운 가능성을 제시하고 있다고 볼 수 있다.