본문 바로가기

IT Note/Data&AI

<텍스트로 비디오 만들기? 직접 해볼게요 : 비디오스튜, 스테이블디퓨전>

2024년 본격 시작!!

<Intro, 해볼게요>

모두 체인쏘우!! 안녕하세요!!

회사 일로 바쁜 나날을 보내고 있습니다. 여러분은 샘 알트먼이라고 아시나요?

그냥 동네 형아님?

OpenAI의 창시자인데요. 이 분이 최근 무려.. 9000조를 자기에게 투자해달라고 연설했습니다.

9000조면 얼만지 아시나요?

사람이름이 구천조 아니죠.. 전청조도 아니고..

MS(4000조) + 애플(3800조) + 국민연금(1000조)하고도 200조가 남아서 피자배달을 시켜먹을수 있습니다...

 

이 사람이 9000조를 펀딩해달라고 하는 건 AI 반도체칩을 만들기 위해서 라는데요.

저 또한 글을 위해 펀딩을 해준다는 분이 나타났습니다.

대사가 들리는 짤..

바로 Text To Video 회사 (ttv) 비디오스튜입니다.

사랑해요 비디오스튜 what's your ttv

 

오늘 AI를 이용해 텍스트로 비디오를 만들어보겠습니다.

생성형 AI에 대해서는 이전에 포스팅한 만큼 오늘은 바로 본론으로 들어간 후 이 ttv들에 대해 비교해 보겠습니다!

https://it-ist.tistory.com/315 

 

생성형 AI? 직접 써볼게요. (Chatgpt, Autogpt, HyperClova X, WatsonX, Midjourney, RVC Crepe V3)

2023년은 생성형 AI의 시대라고 해도 과언이 아닙니다. Chatgpt를 필두로 여기저기서 AI, AI, AI에 대해 외치고 있습니다. 이런 적은 처음이 아닙니다. 1. 이제는 볼드모트가 된 그 이름 2018년을 기억하

it-ist.tistory.com

 

<Text-to-Video, 해볼게요>

 

1. Videostew (https://videostew.com/)

 

일단 거두절미하고 결과물부터 보여드리겠습니다.

 

1. 턱걸이하는 남자

https://www.youtube.com/watch?v=iQma83LFEX0

턱걸이하는 남자

2. 돈암동 살인사건 미스테리

https://youtu.be/guDf_06JfTA

돈암동 살인사건 미스테리

 

일단 이 2개의 영상은 각각 5분 이내의 시간을 투자해 만들었습니다.

첫번째 영상은 chatgpt를 이용해 대본을 만들었습니다.

 

비디오스튜 메인화면

일단 비디오스튜의 장점은 어이없을 정도로 간단하다는 건데요, 이 메인화면 로그인창에서 프로젝트 만들기하고 저 대본을 그대로 복사 붙여넣기하면 끝입니다.

이렇게 대본을 복사 붙여넣기하고

여기에서 여러 세부요소를 정하면된다.

 

이 위자드 모드에서 설정을 하면 끝입니다. 클릭 몇번으로 할 수 있어서 설명할 UX/UI도 너무 간단합니다.

 

그리고 여기에서 세부설정을 2분이내로 해주고 바로 다운로드를 해주었습니다.

 

2번째 영상의 경우에는 이미지를 Bing AI로 무료로 만들어주었습니다.

미드져니같은 경우가 유료가 되었는데 Bing AI는 무료로 아주 쉽게 만들수 있습니다.

https://www.bing.com/images/create?FORM=GENILP

 

 

여기까지하고 장점과 단점을 설명해보겠습니다.

 

***장점***

- 정말 너무너무 쉽다. 초등학생들도 이런 AI 동영상을 10초면 찍어낼수 있을것 같다.

- 텍스트에 맞는 배경을 알아서 생성해준다.

- 나레이션, 배경음악, 전환, 비쥬얼 귀찮은 요소들을 알아서 생성해준다.

- 양산형 비디오에 정말 최적화 되어있다.

 

***단점***

- 퀄리티 있는 영상을 뽑기엔 아직 무리가 있어보인다.

- 짜여진 프레임이 있는 만큼 다른 영상도 비슷한 포맷을 가져갈 수 밖에 없다.

 

***총평***

- 재밌고 쉽게 비디오를 만들 수 있습니다. 또한 팟캐스트와 같은 형태의 비디오를 만드는데 정말 기본 tts(text to speech)보다 최적화되어있다는 생각이 듭니다.

반응형