말을 할 수 없게 만드는 운동 뉴런 질환(MND)을 앓았던 영국 여성이 인공지능(AI) 기술과 오래된 가족 영상 에서 8초 분량의 녹음 파일 덕분에 다시 자신의 목소리를 사용하여 의사소통을 할 수 있게 됐습니다.
런던 북부에 사는 예술가 사라 에제키엘은 25년 전 두 번째 아이를 임신했을 때 34세의 나이에 MND 진단을 받고 말을 할 수 없게 되었습니다.
이 질병은 신경계를 손상시키고, 혀, 입, 목의 근육을 약화시키며, 일부 환자는 말하는 능력을 완전히 상실하게 됩니다.
에제키엘은 수년간 컴퓨터와 음성 생성 기술을 이용해 소통했지만, 그 목소리는 그녀의 목소리와 전혀 달랐습니다. 그녀의 두 자녀 아비바와 에릭은 어머니의 진짜 목소리를 전혀 모른 채 자랐습니다.
최근 몇 년 동안 전문가들은 기술을 사용하여 사람의 원래 목소리를 재현할 수 있었습니다. 하지만 이 기술은 길고 고품질의 녹음을 필요로 하며, 그 결과로 나오는 목소리는 종종 "단조로운" 것으로 간주됩니다.
영국의 의료 미디어 회사인 스마트박스의 대표인 사이먼 풀은 회사가 처음에 에제키엘 씨에게 60분 분량의 녹화본을 제공해 달라고 요청했다고 말했습니다.
하지만 에제키엘 씨는 1990년대 홈비디오에서 찍은 아주 짧고 화질이 좋지 않은 영상만 찾을 수 있었습니다. 8초밖에 되지 않는 영상에 소리가 왜곡되어 있었고 TV 잡음도 섞여 있었습니다.
풀 씨는 뉴욕에 있는 AI 음성 생성 회사인 일레븐랩스가 개발한 기술을 활용했습니다. 이 기술은 매우 적은 데이터로 실제와 같은 음성을 재현할 수 있습니다.
풀 씨는 AI 도구를 사용하여 오래된 녹음에서 음성을 추출한 다음, 실제 음성 데이터로 훈련된 또 다른 도구를 사용하여 최종 제품을 만들었습니다.
그 결과에 에제키엘 부인은 깊은 감동을 받았다. 재현된 목소리는 그녀 자신의 목소리와 매우 흡사했는데, 특유의 런던 억양과 그녀가 이전에는 싫어했던 약간의 혀짧은 발음이 돋보였다.
영국 정신건강국(MND UK)에 따르면, 이 질환을 앓고 있는 사람 10명 중 최대 8명이 진단 후 언어 장애를 경험합니다. 그러나 현재 컴퓨터로 생성된 음성은 리듬감과 감정 표현이 부족하다는 평가를 받는 경우가 많습니다.
풀 씨는 오늘날 AI 기술의 발전은 인간과 유사하고 감정적인 목소리를 만들어낼 수 있는 능력이라고 말하며, 이를 통해 기존의 무미건조했던 컴퓨터 목소리에 "생명을 불어넣는" 것이라고 덧붙였습니다. 그는 목소리를 개인화하는 것 또한 개인의 정체성을 보존하는 방법이라고 강조했습니다.
MND와 같은 질환으로 인해 말을 할 수 있는 능력을 상실할 위험이 있는 사람들은 신원을 보존하고 향후 의사소통을 용이하게 하기 위해 가능한 한 빨리 목소리를 녹음하도록 권장받는 경우가 많습니다.
하지만 스마트폰이 대중화되기 전에는 제대로 된 녹음을 하는 게 쉽지 않았습니다./.
출처: https://www.vietnamplus.vn/ai-tai-tao-giong-noi-cho-mot-phu-nu-anh-mat-kha-nang-noi-25-nam-post1057350.vnp
댓글 (0)