運動ニューロン疾患(MND)で話すことができなかった英国人女性が、人工知能(AI)技術と古い家族のビデオから取った8秒間の録音のおかげで、自分の声を使って再びコミュニケーションできるようになった。
北ロンドンに住むアーティスト、サラ・エゼキエルさんは、25年前、34歳で第二子を妊娠中にMNDと診断され、話す能力を失った。
この病気は神経系にダメージを与え、舌、口、喉の筋肉を弱め、一部の患者は話す能力を完全に失います。
エゼキエルは長年、コンピューターと音声生成技術を使ってコミュニケーションをとっていましたが、その声は母親の声とは似ても似つきませんでした。二人の子供、アヴィヴァとエリックは、母親の本当の声を知ることなく育ちました。
近年、専門家は技術を駆使して人の本来の声を再現できるようになりました。しかし、この技術には長時間にわたる高品質な録音が必要であり、結果として得られる声は「単調」に聞こえることが多いとされています。
英国の医療通信会社スマートボックスの代表サイモン・プール氏は、同社は当初エゼキエル氏に60分間の録音を提供するよう求めたと述べた。
しかし、エゼキエルさんが見つけたのは、1990年代のホームビデオから切り取られた、非常に短く画質の悪いクリップだけでした。クリップの長さはわずか8秒で、音声は歪んでおり、テレビからのノイズも混じっていました。
プール氏は、ごくわずかなデータでリアルな音声を再現できる、ニューヨークに拠点を置くAI音声生成企業イレブンラボが開発した技術に目を向けた。
プール氏はAIツールを使用して古い録音から音声を抽出し、その後、実際の音声データでトレーニングした別のツールを使用して最終製品を作成した。
その結果にエゼキエルは深く感動した。再現された声は、独特のロンドン訛りと、以前は嫌っていたわずかな舌足らずも含め、彼女の本当の声に非常によく似ていた。
英国MND協会によると、この疾患を持つ人の10人中最大8人が診断後に発話障害を経験します。しかしながら、現在のコンピューター生成音声はリズム感や感情表現に欠けていると批判されることが多いです。
プール氏は、今日のAI技術の進歩は、人間らしく感情的な音声を作り出す能力であり、それによって以前は無味乾燥だったコンピューターの音声に「命を吹き込む」ことができるようになったと述べた。また、音声をパーソナライズすることは、個人のアイデンティティを維持する手段でもあると強調した。
MND などの病気により話す能力を失うリスクのある人々は、自分の身元を保持し、将来のコミュニケーションを容易にするために、できるだけ早く自分の声を録音することが推奨されることが多くなりました。
しかし、スマートフォンが普及する前は、適切な録音をするのは簡単ではありませんでした。
出典: https://www.vietnamplus.vn/ai-tai-tao-giong-noi-cho-mot-phu-nu-anh-mat-kha-nang-noi-25-nam-post1057350.vnp
コメント (0)