2월 공개 후 10개월 만에 정식 출시…구글·메타 등과 본격 경쟁 속 딥페이크 우려도
동영상 생성 AI 최강자 떴다
동영상 생성 인공지능(AI) 최강자로 지목된 오픈AI의 '소라'가 드디어 모습을 드러내며 구글, 메타 등 경쟁자들을 긴장시키고 있다. 텍스트만으로도 빠른 시간 내에 원하는 동영상을 간편하게 만들 수 있다는 점에서 일자리 위협을 느낀 예술가들의 반발도 더 커지는 모양새다.
10일 업계에 따르면 오픈AI는 지난 9일(현지시간) 온라인 행사를 통해 '소라'를 정식 출시한다고 발표했다. 지난 2월 처음 공개한 후 10개월 만으로, 그간 일부 이용자들을 대상으로 테스트를 한 후 문제점을 보완해 왔다. 공개 됐을 당시 도쿄 밤거리를 걷고 있는 여성의 다리가 불안정하게 움직이는 등 환각 현상이 발견된 바 있다.
'소라'는 이용자가 글로 프롬프트(명령어)를 넣으면 동영상을 생성해주는 AI로, 생성되는 동영상의 길이는 최대 20초다. 당초 최대 1분 길이의 동영상을 빠르게 제작할 수 있다고 오픈AI가 밝혔던 것에 비해선 상당히 시간이 줄었다.
이에 대해 오픈AI는 "최대한 많은 사람들이 소라에 접근할 수 있도록 하기 위해 성능과 확장성 사이의 균형을 맞춘 것"이라고 설명했다.
'소라'는 텍스트뿐 아니라 이미지, 동영상에서 영감을 받아 동영상을 생성하는 것은 물론, 기존 동영상을 확장하거나 빠진 프레임을 채우는 '스토리보드' 기능도 제공한다. 오픈AI가 공개한 '우주에 떠 있는 토끼(a rabbit floating in outer space)'라는 프롬프트로 만든 데모 시연 영상에선 약 7초만에 5초짜리 동영상이 만들어져 이목을 집중시켰다. 만든 영상이 마음에 들지 않으면 프롬프트를 수정하거나 스토리보드를 고치면 된다.
'소라'는 구글이 올해 1월 공개한 생성 AI 모델 '루미에르'가 단 5초 분량의 영상물을 제작해주는 것에 비해 월등한 기술력을 갖고 있다는 평가를 받고 있다. 이날부터 한국을 포함한 대부분의 국가에서 사용할 수 있지만 영국, 스위스, 유럽경제지역(EEA)은 이번에 출시가 제외됐다. 이는 이들 지역에서 테크 기업에 대한 규제가 강화하고 있는 데 따른 것으로, 영국 등에서의 정식 출시 일정은 미정이다.
'소라'는 현재 '챗GPT 플러스', '챗GPT 프로'에 포함돼 기존 유료 이용자들은 이 동영상 AI 모델 이용에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다. 월 20달러를 지불하는 '챗GPT 플러스' 이용자들은 매월 50개(480p 또는 그 이하 해상도), 월 200달러인 '챗GPT 프로' 구독자들은 매월 500개의 영상을 생성할 수 있다. 챗GPT 팀, 엔터프라이즈, 에듀 계정에선 소라를 쓸 수 없다.
이번 일로 동영상 생성 AI 시장 경쟁은 과열되는 분위기다. 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을, 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를 선보였다. 바이트댄스는 '매직비디오-V2'를, 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다.
오픈AI가 올해 2월 '소라'를 선보인 후에는 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신', 런웨이 '젠-3 알파', 메타 '무비 젠' 등이 지금까지 공개됐다. 어도비도 지난 10월 '어도비 맥스' 행사에서 파이어 플라이 기반 동영상 AI를 발표하며 경쟁에 합류했고, 아마존도 이달 초 '리인벤트' 행사를 통해 동영상 생성 AI '노바 릴'을 처음 선보였다.
이에 따라 유튜브는 내년부터 동영상 생성 AI '비오'를 활용해 유튜브 쇼츠 영상을 만들 수 있게 할 계획이다. 메타는 '무비 젠'이 만든 AI 동영상을 인스타그램 등 SNS와 연계할 수 있도록 할 예정이다. 사용자들은 AI를 사용해 실감나는 릴스(인스타그램을 통해 공유할 수 있는 15초 이내 분량의 짧은 동영상)를 직접 만들어낼 수 있고 페이스북, 왓츠앱, 스레드 등 메타의 다른 SNS 플랫폼에도 공유할 수 있게 된다.
파이낸셜타임스(FT)는 "메타의 무비 젠 AI 동영상 모델은 할리우드 영화 제작사, 동영상 콘텐츠 크리에이터, SNS 인플루언서들의 창조 작업용 툴로 사용되기를 원하고 있다"며 "메타는 영화 등 예능, 오락산업, 광고를 넘어 보다 광범위한 산업 분야에서 수익 창출 모델을 발굴하려고 하고 있다"고 분석했다.
이처럼 본격적인 동영상 생성 AI 시대가 열리면서 영상 관련 산업은 큰 변화를 맞게 됐다. 영화, 애니메이션, 증강현실(AR) 및 가상현실(VR) 등 다양한 분야에서 활용할 수 있게 되면서 일자리를 위협 받는 이들도 상당해질 것으로 예상된다.
실제 소니픽처스는 영화 제작 비용을 줄이기 위해 생성형 AI를 적극 활용하겠다고 공개적으로 밝힌 바 있다. 이미 코카콜라의 최근 홀리데이 캠페인과 같은 광고에선 AI로 제작된 콘텐츠가 등장하고 있다.
영화 CG 일러스트레이터인 리드 사우든은 "2022년 미드저니(이미지 생성 AI)가 처음 나왔을 때 우리는 '귀엽다'며 비웃었다"며 "하지만 이제 사람들은 생성 AI 때문에 일자리를 잃고 있다"고 말했다.
이에 지난해 미국 할리우드에선 배우와 작가를 중심으로 생성형 AI 활용에 대항하기 위해 파업을 벌이기도 했다. 자칭 '소라 PR(대외홍보) 퍼펫'이라고 부르는 예술가 그룹은 지난달 26일 오픈AI '소라'에 접속할 수 있는 프로그래밍 인터페이스(API)를 온라인에 공개하며 반발하는 모습을 보였다.
업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 한꺼번에 풀리면서 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 밝혔다.
일각에선 딥페이크 문제에 대해서도 우려하고 있다. AI 기술로 유명인들의 얼굴을 합성해 정교한 가짜 영상을 만드는 것이 쉬워졌기 때문이다.
이에 오픈AI는 레드팀(취약점을 발견해 AI 안전성을 검증하는 팀)을 만들어 딥페이크를 방지하기 위해 나섰다. 또 '소라'로 생성된 모든 동영상에 C2PA(콘텐트 출처 및 진위 확인을 위한 연합) 표준 AI 워터마크를 넣어 AI가 생성한 콘텐츠임을 알 수 있도록 했다.
로한 사하이 오픈AI 엔지니어링 리드는 "도널드 트럼프 대통령 같은 주요 정치인이나 공적 인물은 생성이 차단된다"며 "잘못된 정보의 확산을 방지하려고 노력하고 있다"고 말했다.
사