Vietnam.vn - Nền tảng quảng bá Việt Nam

Vì sao giọng nói được coi là 'dấu vân tay âm thanh'?

Giọng nói là 'đặc điểm sinh trắc học duy nhất' của mỗi cá nhân. Không có hai người nào có giọng hoàn toàn giống nhau, kể cả sinh đôi cùng trứng.

Báo Thanh niênBáo Thanh niên19/10/2025

Bộ Công an vừa hoàn thành dự thảo Quy chuẩn kỹ thuật quốc gia sinh trắc học giọng nói và dự thảo Quy chuẩn kỹ thuật quốc gia về sinh trắc học mống mắt. Đối với sinh trắc học giọng nói, dự thảo quy định độ tuổi lấy mẫu lần đầu từ đủ 6 tuổi; các lần lấy mẫu cập nhật dữ liệu vào độ tuổi từ 14 - 25, 25 - 40, 40 - 60.

Giọng nói: Dấu vân tay âm thanh độc nhất của mỗi người - Ảnh 1.

Sinh trắc học giọng nói (voice biometrics) là công nghệ nhận dạng và xác thực cá nhân dựa trên đặc điểm sinh học - âm học riêng của giọng nói

Ảnh: PHƯƠNG AN TẠO BỞI AI

PGS-TS Phạm Bích Đào (Bệnh viện Đại học Y Hà Nội) cho biết sinh trắc học giọng nói (voice biometrics) là công nghệ nhận dạng và xác thực cá nhân dựa trên đặc điểm sinh học - âm học riêng của giọng nói. Khác với nhận diện nội dung (voice recognition), sinh trắc học giọng nói tập trung vào cách phát âm, tần số rung, biên độ, độ vang, tốc độ nói, nhịp điệu và mẫu cộng hưởng, tức là "chữ ký sinh học" của giọng nói.

Khẳng định giọng nói là "đặc điểm sinh trắc học duy nhất" của mỗi cá nhân, bác sĩ Đào giải thích: Giọng nói là đặc điểm sinh học cá nhân, phản ánh cấu trúc giải phẫu riêng của thanh quản, xoang cộng hưởng, khoang miệng, cùng thói quen nói, ngữ điệu và cảm xúc. Vì vậy, không có hai người nào có giọng hoàn toàn giống nhau, kể cả sinh đôi cùng trứng. Do đó, giọng nói được coi là "dấu vân tay âm thanh" (audio fingerprint), tương tự vân tay hoặc mống mắt trong nhận dạng sinh trắc học.

Theo bác sĩ Đào, giọng nói là sản phẩm của sự phối hợp phức tạp giữa nhiều cơ quan trong cơ thể, gồm 3 hệ thống chính: hệ hô hấp (phổi, cơ hoành, khí quản - cung cấp luồng hơi); hệ thanh quản (dây thanh âm và sụn thanh quản - tạo dao động âm thanh gốc); hệ cộng hưởng và phát âm (họng, khoang miệng, khoang mũi, lưỡi, môi, răng, khẩu cái - khuếch đại và biến đổi âm sắc). Thực quản và dạ dày có thể tạo ra giọng bụng. Chính vì thế, trong trường hợp cắt thanh quản toàn phần, người ta có thể vận dụng tập nói giọng thực quản. Sự phối hợp tinh vi của các cơ quan này tạo nên đặc trưng âm học riêng biệt cho từng cá nhân.

CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN GIỌNG NÓI

Theo PGS-TS Phạm Bích Đào, một số bệnh lý và yếu tố có ảnh hưởng đến giọng nói. Trong đó, giọng nói có thể thay đổi tạm thời hoặc vĩnh viễn do bệnh lý tại thanh quản (viêm thanh quản, hạt - polyp dây thanh, liệt dây thanh, u thanh quản), bệnh hệ thống như: trào ngược họng - thanh quản, bệnh nội tiết (suy giáp, cường giáp), bệnh thần kinh.

Ngoài ra, một số yếu tố bên ngoài cũng ảnh hưởng đến thanh âm: hút thuốc, rượu, dị ứng, ô nhiễm, stress, lạm dụng giọng. Những thay đổi này làm biến đổi đặc trưng âm học của giọng nói (tần số cơ bản, cường độ…), từ đó ảnh hưởng đến khả năng nhận dạng sinh trắc học. Vì vậy, trong thực tế ứng dụng (như giám định tư pháp hay xác thực an ninh), cần có mẫu giọng tham chiếu ổn định và được cập nhật định kỳ.

Giọng nói nam và nữ có đặc điểm riêng. Trong đó, giọng nói của nam giới có âm trầm, vang do dây thanh dài hơn, dày hơn, tần số thấp (85 - 180 Hz). Với nữ giới, dây thanh ngắn, mảnh hơn, tần số cao (165 - 255 Hz), giọng nói có âm sáng, cao. Ngoài ra, cấu trúc cộng hưởng (xoang, hốc miệng, thể tích ngực) cũng góp phần tạo khác biệt rõ về âm sắc theo giới tính.

Giọng nói có thể thay đổi giới tính sinh học hoặc bị "lệch pha" trong các trường hợp: rối loạn nội tiết tố (dậy thì, mãn kinh, điều trị hormone, chuyển giới); do bệnh lý dây thanh hoặc phẫu thuật thanh quản; do huấn luyện giọng có chủ đích (đặc biệt trong nghề diễn viên, hát, chuyển giới). Khi đó, đặc điểm "giới" của giọng nói có thể biến đổi, gây nhầm lẫn trong nhận dạng sinh trắc học, đặc biệt nếu hệ thống trí tuệ nhân tạo chưa được huấn luyện đa dạng theo biến thể giới.

Các hệ thống sinh trắc học tiên tiến hiện nay có thể phân biệt "chất giọng gốc" nhờ phân tích đặc trưng phổ tần sâu (deep spectral features), ít chịu ảnh hưởng bởi thay đổi bề ngoài. Giọng nói được công nhận là một đặc trưng sinh trắc học hợp pháp, có thể được mã hóa, lưu trữ và so khớp để nhận dạng hoặc xác thực danh tính.

PGS-TS Phạm Bích Đào

Nguồn: https://thanhnien.vn/vi-sao-giong-noi-duoc-coi-la-dau-van-tay-am-thanh-18525101819195149.htm


Bình luận (0)

No data
No data

Cùng chủ đề

Cùng chuyên mục

Giới trẻ lên Tây Bắc check-in mùa lúa chín đẹp nhất năm
Vào mùa 'săn' cỏ lau ở Bình Liêu
Giữa rừng ngập mặn Cần Giờ
Trúng đậm ruốc biển, ngư dân Quảng Ngãi bỏ túi bạc triệu mỗi ngày

Cùng tác giả

Di sản

Nhân vật

Doanh nghiệp

Cốm làng Vòng - vị thu Hà Nội

Thời sự

Hệ thống Chính trị

Địa phương

Sản phẩm

Happy Vietnam
Chợ Nổi Cái Răng
Chợ Nổi Cái Răng