Google Gemini 업그레이드는 Google DeepMind에서 개발한 "나노 바나나" 이미지 모델을 사용합니다. 이 기능은 현재 전 세계 무료 및 유료 사용자 모두에서 사용할 수 있습니다. 가장 큰 장점은 사진 속 얼굴과 사물의 일관성을 유지하는 기능인데, 이는 다른 AI 도구들이 종종 어려움을 겪는 부분입니다.

DeepMind의 제품 책임자인 니콜 브리히토바는 "이미지 품질과 모델의 지시 따르기 능력이 크게 향상되었습니다."라고 말했습니다. "이번 업데이트 덕분에 편집이 더욱 원활해졌고, 결과물도 어떤 용도로든 사용할 수 있을 만큼 훌륭합니다."

모든 사진에 '당신'을 담아보세요

AI 사진이 가짜처럼 보이는 이유 중 하나는 작은 디테일이 왜곡되기 때문입니다. 구글은 제미니가 이 문제를 해결하여 얼굴과 표정은 그대로 유지하면서 전체 장면을 변경할 수 있다고 설명합니다. 이미지 왜곡 걱정 없이 새로운 헤어스타일을 시도하거나, 벽 색상을 바꾸거나, 반려동물을 장면에 추가할 수 있습니다.

사진을 합성하세요.gif
Google Gemini를 사용하여 두 개의 기존 이미지에서 새로운 맥락을 담은 사진을 병합합니다. 출처: Google

제미니를 사용하면 여러 장의 사진을 업로드하여 하나로 합칠 수도 있습니다. 예를 들어, 고양이와 함께 찍은 사진을 합성하여 두 사람이 함께 도로를 달리는 사진을 만들 수 있습니다.

Gemini는 멀티턴 편집을 지원하여 벽지, 가구, 페인트 색상 등 공간에 모든 디테일을 추가할 수 있습니다. 편집이 필요한 부분만 변경되고 나머지는 그대로 유지된다는 장점이 있습니다.

게다가 쌍둥이자리는 사진 속 스타일을 다양하게 조합할 수 있습니다. 예를 들어, 레인부츠를 꽃무늬 신발로 바꾸거나 나비 무늬 원피스를 만들어 보세요.

기술 대기업들 간의 AI 이미지 생성 경쟁

구글의 이번 업그레이드는 AI 이미지 전쟁이 치열해지는 와중에 이루어졌습니다. OpenAI는 이전에 이미지를 직접 생성할 수 있는 GPT-4o를 출시했으며, 스튜디오 지브리 스타일의 밈 시리즈로 큰 인기를 끌었습니다. CEO 샘 알트만은 사용자 수가 너무 많이 증가하여 회사의 GPU가 "거의 녹을 뻔했다"고 밝혔습니다.

이에 발맞춰 Meta는 Midjourney와의 파트너십을 발표했고, 독일 스타트업 Black Forest Labs는 FLUX 모델을 통해 많은 차트를 장악하고 있습니다.

멀티턴 편집.gif
Google Gemini의 다단계 사진 편집 기능. 출처: Google

구글은 제미니가 ChatGPT와의 격차를 좁히기를 기대하고 있습니다. CEO 순다르 피차이에 따르면 제미니는 현재 월간 사용자 수가 4억 5천만 명으로, 주간 사용자 수가 7억 명이 넘는 ChatGPT에 크게 뒤처져 있습니다.

브리히토바는 제미니가 거실과 정원을 시각화하는 것부터 재미있는 사진을 만드는 것까지 실제 상황에 맞춰 설계되었다고 말했습니다. 이 모델은 더 나은 " 세계 지식"을 갖추고 있으며, 여러 사진과 색상 팔레트를 하나의 렌더링으로 결합할 수 있습니다.

하지만 구글은 엄격한 제한도 적용합니다. 생성된 모든 이미지에는 명확한 워터마크와 메타데이터에 숨겨진 식별 표시가 있습니다. 딥페이크 남용을 방지하기 위해 구글은 허가 없이 민감한 이미지를 생성하는 것을 엄격히 금지합니다.

구글은 이전에 제미니의 부정확한 역사적 이미지에 대해 사과한 바 있습니다. 이번에는 창의성과 안전 사이에서 균형을 찾았다고 생각합니다. 브리히토바는 "사용자의 창의성을 존중하지만, 모든 것이 허용되는 것은 아닙니다." 라고 강조했습니다.

Google은 Gemini 2.5 Flash Image를 통해 AI 사진 편집 경험을 한 단계 끌어올리는 데 주력하고 있으며, OpenAI, Meta 및 기타 경쟁사와의 치열한 기술 경쟁에서 기존 사용자를 유지하고 새로운 사용자를 유치하고자 합니다.

(TechCrunch에 따르면, Tom's Guide)

'두뇌' 하나당 8,500만 동(VND)에 엔비디아가 로봇을 만드는 시대를 열었습니다. 엔비디아는 최근 "로봇 두뇌"라는 별칭을 가진 칩인 젯슨 AGX 토르(Jetson AGX Thor)를 출시했습니다. 이 칩은 기계가 사람처럼 보고, 생각하고, 행동하도록 지원하며, 3,499달러라는 가격에 물리적 AI 경쟁을 시작했습니다.

출처: https://vietnamnet.vn/google-gemini-nang-tam-ai-tao-anh-doi-nen-kieu-toc-chi-bang-mot-cau-lenh-2436782.html