여기 영상 한 편이 재생된다. 당신은 고개를 숙이고 단지 소리로만 모든 것을 파악해야 한다. 잔잔한 피아노 선율에 허밍이 섞인 음악이 1분 30초 동안 계속 흐른다. 이후 무언가 달그락거리는 소리와 새소리가 들리며 음악이 서서히 사라진다. 무언가를 닫는 듯한 ‘쾅’ 소리가 연이어 들린다. 호흡 소리도 가끔 들린다. 젊은 여자와 남자가 한국어로 대화한다.
“여기 대체 어디야?”
“집이지.”
이어 어린 여자아이의 유창한 영어 대사가 들린다.
“David, look! (데이비드, 봐!)”
남자가 한국어로 다시 말한다.
“데이비드, 뛰지 마!”
남자아이와 여자아이 영어 대사가 작게 이어진다.
“Look at that! (저것 좀 봐!)”
”Look! Wheel! (바퀴야!)”
이 영상은 드라마일까, 영화일까. 한국 콘텐츠일까, 외국 콘텐츠일까. 장르는 무엇일까? 주어진 청각 정보만으로는 쉽게 대답하지 못할 것이다. 대부분 비시·청각장애인은 궁금함을 참지 못하고, 할 수만 있다면 고개를 들어 영상을 확인할 것이다. 여기서 영상의 모든 정보를 쉽게 파악할 수 있는 행위는 정말 단순하고 쉬운 행동인 “고개를 들어”이다. 단지 고개를 드는 것만으로 당신은 이 영상이 영화〈미나리〉의 시작 부분이었다는 것을 알 수 있다. 대사 없이 음악과 효과음으로 이어지다가 한국어와 영어 대사로 시작하는 이 영화를 시각장애인은 과연 이해할 수 있을까? 만약 청각장애인이라면? 대사(번역 자막) 없는 이 영상을 어디까지 이해할 수 있을까? 장애 정도가 심한 시각장애인과 청각장애인이 영화를 본다고 가정했을 때, 시각장애인에게는 소리 정보만 들릴 것이고, 청각장애인에게는 영상 정보만이 보일 것이다. 두 사람 모두 각기 다른 이유로 누가 말을 하고 있는지, 어떤 대화를 하는지 등 이야기를 이해하기 위한 많은 요소를 놓칠 것이다.
이것은 콘텐츠 접근성이 현저히 떨어지는 예시다. 비시·청각장애인에게는 번역 자막을 제공한다면 충분히 접근성을 높일 수 있다. 번역을 접근성으로 이해한다면 다소 낯설게 들릴 수 있겠지만, 번역학에서 “접근성은 번역의 한 형태이며, 번역은 전인구를 통합하고 넓은 의미에서 모두 함께 문화 행사를 즐길 수 있도록 도와주는 접근성의 한 형태¹ ” 로 이해한다.
그렇다면 번역 자막을 제공하는 것 이상으로 콘텐츠의 접근성을 높이는 방법은 없을까? 물론 있다. 음성 해설(audio description)과 음성 소개(audio introduction), 자막 해설(caption)을 제공하면 보다 많은 사람이 영상을 감상할 수 있다. 음성 해설은 “비언어적으로 전달되는 시청각 기호(이미지, 소리, 자막 등)를 언어로 번역”해 음성으로 들려줌으로써 시각이 불편한 이용자가 영상이나 공연 등 다양한 콘텐츠 내용을 이해할 수 있도록 돕는 서비스를 말한다². 참고로 한국의 경우, 이를 화면 해설(Descriptive Video Service)이라는 이름으로 방송 콘텐츠에 도입했다.
¹ Díaz-Cintas, Orero and Remael, 2007: pp. 13-14 ² 서수연, 이상빈 2021, p 112
음성 해설은 1980년 초 미국 워싱턴 아레나 극장에서 시각장애인 관람객을 위해 연극에 처음 도입되었고, 1980년대 말 워싱턴 방송사 WGBH가 화면 해설을 제공했다³ . 한국의 화면 해설 서비스 시작은 2000년 한국시각장애인연합회가 주도했다. 시범 방송과 준비 과정을 거쳐 2003년 4월 KBS1 드라마〈대추나무 사랑 걸렸네〉를 시작으로 화면 해설(음성 해설) 방송을 지속해서 제공했다. 하지만 화면 해설은 화면에만 국한된 하위어로, 영상뿐 아니라 공연, 전시관, 이벤트 등 다양한 곳에 두루두루 사용하기에 무리가 있고 자막 해설(caption)과 혼동을 일으키는 문제점이 있다.
다행히 현재는 예술계와 다양한 기관, 주체에서 상위어인 음성 해설을 사용한다. (필자도 용어 사용의 혼선을 막고 용어의 정착을 위해, 앞으로 ‘음성 해설’이라고 사용하겠다.) 이러한 음성 해설과 자막 해설은 수어 통역처럼 번역의 한 범주이고, “시(청)각 기호를 원천 텍스트 속 대사와 동일 언어의 해설로 옮긴⁴ ” 것이기 때문에 “기호 간 번역 (inter-semiotic translation)”에 포함돼 연구되고 있다.⁵
위에서 언급한 〈미나리〉를 예시로 시청각 이미지를 언어로 번역한 음성 해설이 어떠한지 살펴보면 아래와 같다.
³ Fryer, 2016
⁴ Lievois & Remael, 2017: 328.
⁵ Jakobson, 2000
1분 30초 동안 음악이 흐르는 장면은 모니카(한예리 분)가 남매 앤과 데이비드를 차에 태우고, 남편 제이콥(스티븐 연 분)이 운전하는 이삿짐 트럭을 따라 허허벌판에 있는 트레일러 집을 찾아가는 여정을 담는다. 비시각장애인은 제이콥과 모니카, 앤, 데이비드라는 이름을 들어도 이들의 외모를 통해 동양인(한국인)이라는 것을 바로 알 수 있다. 하지만 음성 해설을 쓸 때, 이들이 동양인이라는 정보 없이 이름만 말한다면 외국인으로 오해할 수 있다. 시각장애인 이용자는 음성 해설을 통해 이해하기 때문이다. 따라서 이미지 1의 음성 해설은 각 등장인물의 첫 등장에 시각 정보이자 기본 정보인 동양인, 남자아이, 여자아이, 30대 여자라고 알려주고 주변 상황과 이야기의 흐름을 동시에 전달하고 있다. 그리고 무엇보다 해설 문장은 영상의 쇼트(shot)와 일치한다. 참고로 쇼트는 카메라가 다음 피사체를 담을 때까지 이어지는 장면을 말한다. 이미지 1의 괄호 속 숫자는 타임코드다.
쇼트 | 화면 | 정보 | 음성 해설 |
shot 1 | 데이비드 얼굴 측면 클로즈업 | 자동차 창문 너머 얼굴이 보이므로 달리는 차 안임을 알 수 있음. | 동양계 남자아이가 달리는 차 뒷좌석에 묵묵히 앉아 있다. |
shot 2 | 뒷좌석에서 운전석과 조수석, 전면 유리가 보이는 상반신 숏 | 운전하는 모니카의 뒷모습, 조수석에 고개를 푹 숙이고 있는 앤의 뒷모습과 전면 유리 너머 우거진 나무 사이 도로를 달려가는 탑차(이삿짐 트럭)의 뒤꽁무니가 보임. | 차 전면 유리 너머 앞서가는 이삿짐 트럭을 따라 |
shot 3 | 전면 유리와 룸미러 | 룸미러에 모니카의 눈과 코가 비침. | 30대 동양계 여자 모니카가 운전한다. |
표 1. 음성 해설과 쇼트
이렇게 작성된 음성 해설 대본은 스튜디오에서 연출가와 낭독자, 엔지니어가 녹음해서 믹싱 과정을 거친 후 음성 해설 버전으로 제작된다. 여기에 추가로 음성 소개(audio introduction)가 있다. 음성 소개는 음성 해설로 설명하지 못하는 부분을 보충한다. 음성 해설은 대사와 대사 사이 빈 공간에 전략적으로 해설을 끼워 넣기 때문에 모든 정보를 설명하는 데 한계가 있다. 아래는 일반적으로 음성 해설 문장이 대사와 대사 사이에 어떻게 들어가는지 보여주는 사례다.
음성 소개는 영화에서 공간의 제약으로 설명하지 못한 부분, 예를 들어 공간, 의상, 움직임, 등장인물 외모, 소품 등 오디오 혹은 영상 파일로 제공하는 것을 말한다. 아래 이미지는 필자가 음성 소개 대본을 쓰고 배리어프리영화위원회가 제작한 음성 소개 영상⁶ 이다.
⁶ 영화 〈멍뭉이〉 음성 소개 링크_배리어프리영화위원회 제작
이렇게 음성 소개를 미리 제공하면 시각장애인 관객은 더 생생하고 입체적으로 음성 해설 버전 영화를 감상할 수 있고, 감상 후에도 음성 소개를 다시 이용하며 영화 내용을 곱씹어 볼 수 있다. 하지만 음성 해설 버전 영화는 청각장애인 이용자에게는 별 도움이 되지 못한다. 이들에게 필요한 것은 자막 해설(caption)이다. 발화자는 누구인지, 어떤 효과음이 들리는지, 어떤 분위기의 음악이 흐르는지 등을 화면에 자막으로 설명해 주는 서비스가 요구된다. 〈미나리〉 경우 자막 해설은 아래와 같이 제작할 수 있다.
모니카는 심장이 약한 아들 데이비드를 위해 매일 밤 자가 진단을 한다. 청진기로 데이비드의 심장 소리를 확인하는 것이다. 이미지 4는 데이비드가 자기도 심장 소리를 듣고 싶다고 말하자 모니카가 청진기를 건네주는 장면이다. 괄호 속에 적힌 이름 ‘모니카’는 발화자가 누구인지 알려주는 정보다. 자막 해설은 보통 등장인물이 말하는 순간, 효과음이 들리는 순간, 음악이 흐르는 순간에 맞춰 화면 하단에 자막으로 설명이 뜬다. 이미지 4를 표로 살펴보면 아래와 같다.
영상 | 자막 해설 |
모니카가 “귀에 꽂고”라고 발화하는 순간 자막이 흐른다. | (모니카) 귀에 꽂고 |
모니카가 데이비드에게 청진기를 건네줄 때 맞춰 자막이 흐른다. | 청진기 달그락 소리 |
데이비드가 청진기를 귀에 꽂은 후 심장 소리가 들릴 때 자막이 흐른다. | 심장 쿵쿵쿵 뛰는 소리 |
모니카가 발화할 때 자막이 흐른다. | (모니카) 기도하는 거 잊지 말고 |
표 2. 영상의 이미지와 자막 해설
발화자의 경우, 등장인물의 입술이 움직이기 때문에 어떤 경우는 이름을 알리지 않아도 된다. 다만, 등장인물이 등을 돌리고 있거나 화면 밖에서 소리가 나는 경우 발화자 고지 및 효과음 설명을 반드시 해야 한다. 음성 해설과 자막 해설을 제공하는 〈미나리〉가 접근성이 좋은 콘텐츠라고 단정 지어 말할 수 있을까. 그렇지 않다. 다국어 문제가 해결되지 않았기 때문이다. 이제는 한국 콘텐츠에도 영어뿐 아니라 다양한 언어 등장이 자연스럽기에, 시력이 불편한 이용자를 위한 더빙, 청력이 불편한 이용자를 위한 번역 자막 혹은 더빙한 대사를 자막으로 바꿔서 제공하는 것이 반드시 고려되어야 한다. 콘텐츠의 접근성을 높이는 방법과 제공 방식 모두 다양하다. 예를 들어, 넷플릭스와 디즈니플러스와 같은 OTT나 TV 방송은 폐쇄형 음성 해설과 자막 해설 제공으로 시청자가 선택적으로 이용할 수 있다. 원치 않으면 끌 수 있다는 뜻이다. 공연장도 음성 해설이나 자막 해설을 제공할 경우 ‘접근성 회차’라고 고지한다. (이 같은 서비스가 필요하지 않은 이들은 일반 회차를 예매하면 된다.) 공연장에서 음성 해설을 폐쇄형으로 제공할 경우 관람객은 수신기를 대여해 객석에 앉아 이어폰을 귀에 꽂고 음성 해설을 들으며 공연을 관람할 수 있다.
제공 방식(폐쇄형과 개방형)과 별개로, 이러한 서비스를 제공한다는 것은 콘텐츠의 접근성을 높인 것이기에 의미가 크다. 이것은 “연령, 문화, 교육 또는 능력과 상관없이 최대한 많은 사람에게 편의성을 제공하는 인구 벨 곡선을 목표”로 한다고 할 수 있다⁷ . 이미지 6은 인구 벨 곡선을 보여주는데, 정중앙을 겹쳤을 때 대칭을 이루는 가운데 양쪽에 이용자 분포도가 높음을 보여준다. 이러한 상태를 목표로 하는 것이 유니버설디자인이다.
⁷ Bringolf, 2008, p. 48
유니버설디자인은 “다양한 제품과 환경을 가능한 많은 사람이 사용할 수 있도록 개조나 특수 설계할 필요 없이 제작하고 제공하는 디자인”을 말한다 . 이러한 유니버설디자인의 대표적 예로 저상버스나 자동문, 경사로 등을 들 수 있다. 콘텐츠를 예로 들면, 배리어프리영화위원회가 제작하는 작품들이 그렇다. 배리어프리영화위원회에서 ‘배리어프리 버전’으로 제작하는 영화는 앞서 소개한 〈미나리〉를 비롯해 〈풀 타임〉 〈그렇게 아버지가 된다〉 〈코다〉 등 해외 영화의 경우 음성 해설과 자막 해설, 더빙을 모두 통합으로 제작해 개방형으로 상영한다. 관람객 모두 극장 스피커를 통해 더빙된 성우 목소리와 음성 해설 들을 수 있고, 스크린 하단에 흐르는 자막 해설을 볼 수 있다. ‘배리어프리 버전’으로 제작된 영화는 수신기를 대여해서 귀에 꽂고 들을 필요가 없고, 언어 장벽에 불편함을 느낄 필요 없으며, 번역 자막을 읽을 필요도 없다. 대신 효과음과 발화자 등을 설명하는 자막 해설을 제공하기 때문에 청력이 불편한 이용자들도 유용하게 이용할 수 있다. 음성 해설과 자막 해설, 더빙에 대한 필요성이 알려지고, 과거에 비해 인식이 보다 개선되었지만, 비시·청각장애인 대부분은 이 서비스들이 무엇인지, 더빙이 왜 필요한지 여전히 잘 알지 못한다. 콘텐츠가 넘쳐나는 세상에 접근성 높은 콘텐츠 역시 현저히 부족하다. 정부와 각계각층의 인식 개선이 선행되어야 하고 캠페인과 관련 연구도 뒤따라 하는 이유가 바로 여기에 있다. 접근성을 높인 콘텐츠들이 반짝 유행처럼, 혹은 시혜의 수단으로 이용되지 않고, 필요성을 제대로 인식한 상태에서 유니버설디자인으로 점점 더 확장되고 확산하기를 바라는 것으로 이 글을 마친다.
⁹ Aslaksen 외 1997