AI 숏폼 얘기를 하면 다들 자동화부터 말합니다. 그런데 솔직히 자동화보다 먼저 봐야 할 게 있습니다. 결과물이 재밌냐는 겁니다. 아무리 n8n이 예쁘게 돌아가도, 나온 영상이 3초 만에 넘겨지는 싸구려 무빙 포스터면 아무 소용이 없습니다.
이번 편은 도구 이름을 외우는 글이 아닙니다. Seedance, Kling, Runway 같은 영상 모델을 실제 숏폼 포맷에 어떻게 나눠 붙일지 보는 글입니다. 모델 하나가 모든 장면을 잘 만들 거라고 믿으면 결과물이 금방 비슷해집니다. 장면의 성격이 다르면 도구의 역할도 달라져야 합니다.

AI 영상 모델을 고를 때 ‘뭐가 제일 좋아요?’라고 묻는 순간 이미 반쯤 틀렸습니다. 숏폼에서는 모델 순위보다 포맷 궁합이 더 중요합니다.
1. 짧은 상황극은 예쁜 그림보다 컷 연결이 먼저다
숏폼 상황극은 15초 안에 사람을 붙잡아야 합니다. 여기서 흔한 실패는 첫 장면만 예쁜 겁니다. 비 오는 지하철, 편의점 심야근무, 회사 엘리베이터, 헤어진 연인의 문자. 첫 컷은 그럴듯합니다. 그런데 다음 컷에서 인물 얼굴이 살짝 바뀌거나, 손에 들고 있던 휴대폰이 사라지거나, 카메라 위치가 뜬금없이 바뀌면 바로 깨집니다.
Kling 쪽이 자주 언급되는 이유는 캐릭터 일관성, 멀티샷, 네이티브 오디오 같은 제작형 기능을 강조하기 때문입니다. Seedance도 2.0에서 텍스트, 이미지, 오디오, 비디오 입력을 함께 다루는 통합 오디오-비디오 구조를 내세웁니다. 이 방향은 숏폼 상황극과 잘 맞습니다. 짧은 영상은 대사, 표정, 소리, 카메라가 따로 놀면 바로 허술해지니까요.
단, 여기서 착각하면 안 됩니다. 모델이 멀티샷을 지원한다는 말은 ‘내가 대충 써도 드라마가 나온다’는 뜻이 아닙니다. 오히려 프롬프트를 더 구체적으로 써야 합니다. 누가 말하는지, 컷마다 감정이 어떻게 변하는지, 카메라가 어디서 보는지, 다음 장면에서 어떤 물건이 유지돼야 하는지까지 적어야 합니다.
2. ASMR·제품형은 소리와 질감이 반이다

ASMR이나 제품형 숏폼은 대본이 길 필요가 없습니다. 오히려 말이 많으면 망합니다. 핵심은 질감입니다. 유리컵에 숟가락이 닿는 소리, 아이스 디저트가 갈라지는 순간, 화장품이 피부에 펴지는 질감, 제품 포장지를 뜯는 소리. 이런 영상은 장면 하나하나가 감각을 팔아야 합니다.
Seedance 1.5 pro와 2.0이 네이티브 오디오, 립싱크, 공간감, 오디오-비디오 결합을 강조하는 이유도 이 지점과 닿아 있습니다. 예전처럼 이미지 따로, 효과음 따로, 편집 따로 붙이면 싼 티가 납니다. 화면은 차가운 젤리인데 소리는 종이 구기는 소리면 사람은 바로 압니다. 설명은 못 해도 손가락은 넘깁니다.
Runway는 조금 다른 방향에서 봐야 합니다. Gen-4.5는 물리적 정확성, 시각적 충실도, 프롬프트 준수 같은 말을 전면에 둡니다. 제품형 숏폼에서 이건 꽤 중요합니다. 액체가 흐르고, 천이 흔들리고, 머리카락이나 유리 질감이 유지되는 장면은 작은 오류가 바로 보입니다.
제품형 숏폼은 ‘AI로 만들었다’보다 ‘사고 싶다’가 먼저 떠야 합니다. 영상 모델의 성능 자랑보다 제품의 감각을 먼저 설계해야 합니다.
3. 괴담·미스터리는 실패해도 콘텐츠가 될 수 있다

AI 영상으로 가장 만들기 쉬워 보이면서도 은근히 어려운 게 괴담입니다. 왜냐하면 괴담은 조금 어색해도 분위기로 넘어갈 수 있는데, 선을 넘으면 바로 개그가 됩니다. 편의점 CCTV, 빈 복도, 새벽 엘리베이터, 문틈 그림자 같은 소재는 AI 영상과 잘 맞습니다. 하지만 인물이 정면으로 길게 나오고 대사가 많아지는 순간 위험해집니다.
나는 괴담형 AI 숏폼을 만든다면 오히려 정면 얼굴을 줄이겠습니다. 손, 뒤통수, 반사, 모니터 화면, 문틈, 발소리, 조명 깜빡임으로 밀고 갑니다. 이러면 모델의 약점도 줄고, 장르 분위기도 살아납니다. AI의 한계를 숨기는 게 아니라 연출로 우회하는 겁니다.
여기서 실패작을 버리기만 할 필요도 없습니다. ‘AI가 만든 편의점 괴담이 왜 웃겨졌나’ 같은 실험형 콘텐츠는 오히려 잘 먹힐 수 있습니다. 완벽한 결과만 보여주면 광고 같지만, 실패한 장면을 분석하면 사람이 만진 콘텐츠처럼 보입니다.
4. 도구별로 역할을 나누면 이렇게 본다
내 기준으로는 이렇게 나눠 봅니다. 물론 모델은 계속 바뀌기 때문에 영원한 답은 아닙니다. 하지만 제작 사고방식으로는 꽤 쓸 만합니다.
- Seedance: 오디오와 장면이 같이 살아야 하는 짧은 드라마, ASMR, 광고형 테스트에 먼저 넣습니다.
- Kling: 같은 인물이 여러 컷에 이어지는 상황극, 캐릭터 일관성, 대사와 분위기가 있는 장면에 우선 테스트합니다.
- Runway: 고품질 컷, 제품 질감, 물리적 움직임, 후반 편집 제어가 중요한 장면에 씁니다.
- Veo·플랫폼 내 생성 기능: Shorts 같은 모바일 퍼스트 포맷과 직접 연결되는 실험에 봅니다.
- CapCut·OpusClip: 모델이 만든 원석을 숏폼 문법으로 자르고, 자막과 리듬을 붙이는 후반 작업 쪽입니다.
5. 프롬프트보다 먼저 정해야 하는 것
사람들이 프롬프트 예시를 너무 좋아합니다. 이해합니다. 바로 복사해서 돌려보고 싶으니까요. 그런데 프롬프트보다 먼저 정해야 할 게 있습니다. 포맷입니다. 한 영상이 웃긴 상황극인지, 감각형 제품샷인지, 괴담인지, 정보 요약인지, 실험 후기인지 정하지 않고 프롬프트만 늘리면 결과물이 조립식 장난감처럼 됩니다.
예를 들어 ‘비 오는 지하철에서 의문의 전화를 받는 직장인’이라는 소재가 있다면, 이것을 미스터리 상황극으로 만들지, AI 영상 모델 비교 실험으로 만들지, 프롬프트 튜토리얼로 만들지 먼저 정해야 합니다. 같은 소재라도 포맷이 다르면 컷 수, 대사, 자막, 음악, 결말이 전부 달라집니다.
숏폼은 짧아서 쉬운 게 아닙니다. 짧아서 거짓말할 시간이 없는 겁니다. 장면이 별로면 설명으로 못 구합니다.
내 결론: 모델을 고르기 전에 채널의 장르를 골라야 한다
Seedance, Kling, Runway는 다 매력적입니다. 하지만 세 모델을 다 쓰면 좋은 채널이 되는 건 아닙니다. 오히려 아무 장르나 다 해보는 채널은 금방 흐려집니다. 오늘은 괴담, 내일은 제품 광고, 모레는 뉴스 요약, 그다음은 어설픈 연애 상황극. 이렇게 가면 알고리즘보다 사람이 먼저 헷갈립니다.
내가 AI 숏폼 채널을 새로 만든다면 한 달은 도구를 늘리지 않겠습니다. 대신 장르 하나를 정합니다. 예를 들면 ‘새벽 편의점 괴담’, ‘회사원 15초 미스터리’, ‘디저트 ASMR 실험실’ 같은 식입니다. 그다음 모델을 붙입니다. 도구가 주인공이 아니라 포맷이 주인공이어야 오래 갑니다.
자료 확인 기준: 2026년 6월 28일. ByteDance Seedance 2.0 · ByteDance Seedance 1.5 pro · Kling AI Video Generator · Kling VIDEO 3.0 Model User Guide · Runway Gen-4.5 · CapCut AI Video Generator · OpusClip official · ElevenLabs Dubbing Studio · Business Insider: Disney and Netflix letter to ByteDance
'AI' 카테고리의 다른 글
| AI 코딩 딸깍론, 일정 줄이면 망합니다 (1) | 2026.06.29 |
|---|---|
| n8n으로 AI 숏폼 공장 만들기 전, 먼저 막아야 할 것들 (0) | 2026.06.29 |
| AI 숏폼 자동화, 계정부터 망가집니다 (0) | 2026.06.28 |
| 카메라 없는 AI 안경이 더 끌리는 이유 (0) | 2026.06.27 |
| AI 에이전트, 브레이크가 필요해졌다 (0) | 2026.06.19 |