생성적 AI 도구가 폭발적으로 늘어나면서 사용자는 설명적 텍스트로부터 멋진 기사, 이미지, 음악, 비디오를 만들 수 있게 되었습니다.
기술 대기업 간의 경쟁이 점점 더 치열해지고 있습니다. 5월 말, 구글은 립싱크 영상과 자동 음성 해설 기능을 갖춘 Veo 3를 출시했습니다.
뒤처지지 않기 위해 OpenAI는 2024년 2월에 업그레이드된 버전인 Sora 2를 출시했습니다.
Sora 2는 물리 법칙을 정확하게 시뮬레이션하여 움직이는 인터랙티브 장면을 생생하게 구현하는 것이 특징입니다. 특히 최대 영상 길이는 10초로, Veo 3(8초)보다 약간 깁니다.
Sora 2가 다양한 스타일로 생성한 비디오(비디오: OpenAI).
Sora 2는 이미지 렌더링 기능 외에도 배경음 생성, 캐릭터 대화 기능을 통합했으며 베트남어를 포함한 여러 언어를 지원합니다.
또 다른 하이라이트는 카메오 기능입니다. 얼굴과 목소리를 녹화한 짧은 영상을 업로드하기만 하면, 사용자는 AI가 생성한 영상으로 바로 "변신"할 수 있습니다.

Sora 2는 사용자의 샘플 영상을 AI가 생성한 영상으로 결합할 수 있습니다(사진: OpenAI).
OpenAI의 CEO인 샘 알트먼은 Sora 2를 "지금까지 만들어진 것 중 가장 강력한 상상력 구축 도구"라고 부르며 사람들이 재미있는 영상, 광고 또는 예술적 아이디어를 만드는 데 도움이 되기를 바랍니다.
그러나 얼굴 주입 기능은 오해의 소지가 있거나 불쾌감을 주는 콘텐츠를 제작하는 데 악용될 수 있다는 우려를 불러일으킵니다. OpenAI는 AI가 생성한 동영상을 식별하기 위해 엄격한 검열을 적용하고 "Sora"라는 라벨을 붙일 것이라고 밝혔습니다.
CEO 샘 알트먼이 Sora 2에서 생성된 비디오 위에 겹쳐져 있습니다(비디오: OpenAI).
Sora 2는 현재 미국과 캐나다에서 iOS를 대상으로 제한적인 테스트를 진행 중이며, 테스트 단계 이후 Android 및 기타 국가로 확장할 계획입니다.
출처: https://dantri.com.vn/cong-nghe/video-va-am-thanh-an-tuong-tu-cong-cu-ai-moi-cua-openai-20251002125910913.htm
댓글 (0)