Ein Making-of-Musikvideo, in dem der Yeti selbst erzählt, wie der Yeti entstand — gebaut fast komplett aus Material, das es schon gibt.
Die Making-of-Website ist bereits Skript und Storyboard: Genesis → Genre-Pivot → Casting → Konsistenz-Kniff → die Labor-Katastrophen → Kosten. Dazu existieren 21 fertige Szenen, die Modell-Vergleiche, der Lip-Sync-Artefakt-Clip, die Kosten-Balken, die Thumbnail/OG-Artworks und drei Song-Fassungen. Ein Making-of-Video ist hier zu ~80% ein Schnitt-Job, kein Generierungs-Job. Es fehlt im Kern nur eine Erzähl-Klammer — und genau die entscheidet alles.
Damit Helmut seine eigene Entstehung „präsentiert", muss er in die Kamera sprechen — und genau langes Talking-Head-Lip-Sync hat das Projekt nie gelöst. Also drumherum bauen, nicht dagegen:
Helmut reagiert, gestikuliert, zeigt — eine Stimme aus dem Off erzählt. Null Sync-Risiko. Braucht aber eine gesprochene Stimme (TTS, neue Abhängigkeit). Solide, aber am wenigsten „on brand".
RISIKO: NIEDRIGHelmut rappt das Making-of. Rap-Kadenz braucht nur lose Mundbewegung, keinen Phonem-Sync — die bewiesene sichere Zone des Projekts. Reuse der ganzen Suno-Pipeline. Zahlen/Fakten als On-Screen-Text. On brand, witzig, technisch risikoarm.
RISIKO: NIEDRIGNur 2–4 s Schnipsel, die „okayen" v3/Hedra-Closeups, Artefakte als augenzwinkernder Charme. Höchstes Kosten-/Qualitätsrisiko und genau die Falle, die das Originalbudget gesprengt hat.
RISIKO: HOCHEmpfehlung: Option 2, mit Text-Overlays für die harten Zahlen. Ein Yeti, der rappt, wie er fast ein Schlagerstar wurde, ohne 4 Referenzwinkel zum Pavian driftete und $30 an einem Timeout-Bug verbrannte — das ist ein besseres Video als ein trockener Explainer und spielt jede vorhandene Stärke aus.
Jeder Beat ist eine Rap-Sektion. Spalte „Gedeckt durch" zeigt: fast alles existiert bereits — neue Host-Clips nur als Klammer.
| # | Beat | Rap-Sektion | Gedeckt durch (vorhanden) | Neu? |
|---|---|---|---|---|
| 1 | „Eigentlich war ich Schlager"Der Genre-Pivot als Cold Open | Intro / Hook | 3 Song-Fassungen (Mixer), Genesis-Zitate | nein |
| 2 | Das Casting4 Maskottchen, der Yeti gewinnt | Verse 1 | Casting-Cards (Site-Capture), helmut_ref | nein |
| 3 | Der Konsistenz-Kniff1 Ref → Pavian; 4 Winkel + Edelweiß | Verse 1 | Ref-Extras, Drift-Beispiel | nein |
| 4 | Der Bake-offVeo → Kling → Seedance | Verse 2 | bakeoff_kling vs. seedance | nein |
| 5 | Die Ghost-Spend-Katastrophe$30 an einem Timeout verbrannt | Verse 2 / Bridge | Kosten-Balken, Batch-Log, Warn-Callout | nein |
| 6 | Lip-Sync-FailDas MuseTalk-Artefakt-Gesicht | Bridge | ls_musetalk-Clip (Selbstironie-Gag) | nein |
| 7 | Helga, die nicht bliebZweitstimme, Zwei-Figuren-Problem | Bridge | helga_ref + Duo-Frame | nein |
| 8 | Der Reveal21 Szenen · $63→~$90 · das Video | Final Hook / Outro | Storyboard-Grid, Final-Video, Kosten-Stats | nein |
Neue Generierung nur für die Host-Klammer: Intro (Helmut im „Studio"), ~6 kurze Reaktions-/Interstitial-Beats, Outro. Alles Single-Character, kurz, lange Timeouts, Einzel-Takes — exakt die Ghost-Spend-Lektion.
Der Löwenanteil ist Edit/Assembly, nicht Generierung. Site-Screen-Capture ist der höchste-Wert/niedrigste-Kosten-B-Roll des ganzen Projekts.
Die Comedy-Hooks (Schlager→Rap, Pavian-Drift, Artefakt-Gesicht, $25→$90) tragen das Video. Technische Tiefe ist Textur, nicht das Rückgrat.
Host-Shots nicht auf Perfektion re-rollen — exakt so hat das Original sein Budget verbrannt. Einzel- Takes akzeptieren, Lo-Fi ist Charme.
Nicht doch ins lange Talking-Head abrutschen. Rap-Kadenz + Text-Overlays bleiben in der sicheren Zone — diszipliniert bleiben.
Bevor irgendein Budget fließt: die 8 stärksten Beats auf (a) die Meta-Rap-Lyric-Sektionen und (b) das jeweils deckende vorhandene Asset mappen — damit schwarz auf weiß steht, wie wenige neue Clips wirklich nötig sind.