안면 인식 기술과 3D 얼굴 모델링이 보안, 의료 , 전자상거래, 개인 보안 등 여러 분야에서 점점 더 널리 적용됨에 따라, 체계적이고 다양하며 대규모의 얼굴 이미지 데이터베이스를 구축해야 할 필요성이 시급해지고 있습니다. 오늘날 주요 과제 중 하나는 다양한 조명 조건과 다양한 촬영 각도에서 일관된 품질의 이미지 데이터를 수집하는 동시에 데이터 분류 및 저장의 정확성을 보장하는 방법입니다.
이러한 문제를 해결하기 위해 베트남-한국 과학 기술연구원(VKIST) 연구팀은 VKIST 얼굴 캡처 소프트웨어를 개발했습니다. 이 소프트웨어는 여러 대의 디지털 카메라와 조명 모듈로 구성된 시스템을 동시에 제어할 수 있는 도구로, 얼굴 이미지 데이터를 실시간으로 수집, 레이블링, 저장할 수 있습니다.
얼굴 이미지 데이터 수집 및 처리 솔루션
VKIST 얼굴 캡처는 C# 언어로 프로그래밍되었으며, 베트남어로 사용하기 편리한 인터페이스를 갖추고 있어 통합과 확장이 쉽습니다.
VKIST 얼굴 캡처 기능을 사용하면 USB 인터페이스와 RS232 프로토콜을 통해 5DmarkII, 5DMarkIII, 6DMarkII, 1500D, 2000D, D60, D3000, D5100, D7100, D4, D800 등 니콘 및 캐논 DSLR 카메라를 원격으로 제어할 수 있습니다. 사용자는 라이브 뷰(Live View)를 통해 실시간 이미지 확인, 조리개, 셔터 속도, ISO 등의 기술 파라미터 조정, 동시 사진 촬영 명령, 사진을 컴퓨터로 실시간 전송 등의 작업을 수행할 수 있습니다.
특히, 이 소프트웨어는 여러 대의 카메라를 동시에 제어할 수 있도록 지원하는데, 이는 다각도 이미지 데이터 수집 시스템에 필수적인 기능입니다. 소프트웨어 인터페이스는 베트남어로 제공되며, 복잡한 시스템에 쉽게 통합하고 사용하기 편리하도록 별도의 기능 블록으로 설계되었습니다.
VKIST 얼굴 캡처 소프트웨어 인터페이스(그림 1)는 그림 2에 설명된 기능을 갖춘 별도의 블록으로 나뉩니다. 소프트웨어에 표시되는 언어는 베트남어입니다.
VKIST 얼굴 캡처 소프트웨어 인터페이스.
소프트웨어의 주요 기능 블록을 나타낸 다이어그램입니다.
VKIST 얼굴 캡처는 구성 파일에서 조명 제어 회로로 데이터를 전송하여 조명 시스템의 조도를 제어하는 기능도 통합합니다. 이를 통해 촬영 과정 중 조명 환경이 정밀하게 제어되어 AI 애플리케이션의 핵심 요소인 일관된 이미지 품질을 보장합니다.
또한, 이 소프트웨어에는 조도 제어 기능도 통합되어 있습니다. 사용자는 사용 가능한 조도 매개변수 파일을 입력한 후, 소프트웨어를 사용하여 데이터를 읽고 매개변수를 조도 제어 회로로 전송하기만 하면 됩니다. 이를 통해 주변 환경의 조도를 정확하게 제어할 수 있습니다.
또 다른 주요 기능은 데이터 구조에 따라 자동으로 레이블을 지정하여 AI 모델 관리, 검색 및 학습 프로세스를 더욱 효율적으로 만드는 기능입니다. 이 소프트웨어는 데이터 저장 모드 옵션(카메라 로컬 저장, 컴퓨터 저장)과 사전 정의된 시나리오에 따른 데이터 분류를 지원합니다.
또 다른 뛰어난 기능은 미리 정해진 구조에 따라 이미지에 자동으로 레이블을 지정하는 기능으로, 수동 분류 시간을 크게 단축합니다. VKIST 얼굴 캡처 기능을 사용하면 폴더별, 사물별, 표정 유형별 또는 안경 착용, 마스크 착용, 헤어스타일 변경 등 다양한 기준으로 이미지를 저장할 수 있습니다.
또한, 이 소프트웨어는 순차 녹화, 덮어쓰기 또는 서버로 전송하기 전 카메라에 저장하는 등 다양한 데이터 저장 모드를 지원합니다. 이를 통해 시스템은 대용량 이미지를 유연하게 처리할 수 있으며, 작동 중 데이터 손실이나 병목 현상 발생 위험을 최소화할 수 있습니다.
인공지능 연구 플랫폼 및 대규모 얼굴 데이터베이스 구축
이 소프트웨어는 현재 VKIST에서 구축한 얼굴 이미지 데이터 수집 시스템에 사용되고 있습니다. 이 시스템에는 캐논 DSLR 카메라 33대, 조절식 조명 모듈 20개, 카메라와 조명을 반구 주위에 배치하는 철제 프레임, 그리고 모니터와 시스템 제어 소프트웨어가 장착된 고성능 PC 3대가 포함됩니다. VKIST-나센테크 공동 연구실/정보기술부는 이 시스템을 통해 약 500명(약 500만 장)의 얼굴 이미지 데이터베이스를 수집 및 구축해 왔으며, 앞으로도 더 많은 데이터를 수집할 예정입니다.
VKIST 얼굴 캡처 소프트웨어를 사용하여 다각도 얼굴 이미지 데이터 샘플을 수행했습니다.
이 소프트웨어는 한국과학기술연구원(KIST)과의 공동 프로젝트에서 1,000명 이상의 베트남 사람들의 얼굴 이미지 데이터를 수집하는 데 사용되었습니다. 이 데이터베이스에는 다양한 조명 조건에서 정상, 행복, 슬픔, 두려움, 화남, 놀람, 짜증, 그리고 가면, 안경, 모자, 가발과 같은 가려진 액세서리를 착용한 약 1,000만 장의 사진이 포함되어 있습니다.
모든 사양을 갖춘 소프트웨어 인터페이스.
VKIST 얼굴 캡처 소프트웨어를 사용하여 시스템에서 수집된 데이터는 다양한 연구 및 기술 개발 방향에 적용되었으며 현재도 적용되고 있습니다.
다각도 2D 사진으로부터 3D 얼굴 모델링,
변형된 조건(모호함, 복잡한 조명)에서 얼굴 인식 기술의 정확도를 높입니다.
유리에 얼굴을 3D 레이저로 새겨 기념품으로 사용 가능
오래된 사진에서 사망한 사람의 얼굴 이미지를 재구성하여 문화 및 유산 보관 목적으로 활용합니다.
전자상거래, 의료미학, 증강현실에 응용됩니다.
VKIST 얼굴 캡처 기술의 개발과 응용은 VKIST가 대규모 데이터베이스를 구축하는 데 주도적인 역할을 할 수 있도록 도울 뿐만 아니라, 베트남의 컴퓨터 비전과 인공지능 분야 연구 역량을 향상시키는 데에도 기여합니다. 이 분야는 제4차 산업혁명의 핵심 분야입니다.
특수 하드웨어 시스템(특히 다중 장치 광학 시스템)을 제어하는 소프트웨어 기술을 숙달하고 익히는 것은 베트남인의 인체 측정학적 특성에 적합한 국내 AI 플랫폼을 구축하는 데 중요한 역할을 합니다.
VKIST 얼굴 캡처는 베트남에서 컴퓨터 비전 시스템 연구 및 구축을 위한 첨단 소프트웨어 도구 개발을 보여주는 사례입니다. 대규모 이미지 데이터 수집 시스템의 제어 및 동기화 기술을 습득하는 것은 베트남의 인공지능 개발 역량 강화, 특히 지역적 또는 민족지학적 특성을 지닌 인체 계측 데이터가 필요한 분야에서 중요한 기반이 될 것입니다.
IT 부서는 "VKIST 얼굴 캡처" 소프트웨어의 전체 프로그램을 완성하고 테스트한 직후 해당 소프트웨어의 저작권을 등록했습니다.
VKIST 얼굴 캡처 소프트웨어에 대한 저작권 등록증.
출처: https://mst.gov.vn/vkist-face-capture-phan-mem-thu-thap-du-lieu-anh-khuon-mat-da-goc-phuc-vu-nghien-cuu-va-phat-trien-ai-197250927011551324.htm
댓글 (0)