Sieben Modelle, ein Generator. Jedes Kling-Modell bewältigt eine andere kreative Aufgabe — von promptgeführtem Video und referenzfixierter Animation bis hin zu Bewegungsübertragung und KI-Bilderstellung. Nutzen Sie die Vergleichstabelle unten, um das richtige Modell für Ihren Workflow zu finden, und starten Sie dann die Generierung.
Erkunden Sie jede Modellseite für vollständige technische Spezifikationen, Anwendungsfälle und Generierungsbeispiele.
Text-zu-Video, Bild-zu-Video, Multi-Shot-Sequenzierung, optionales Audio und 4K-fähige Renderings mit physikalisch korrekter Bewegung.
Referenzgeführtes Video mit Stilerhaltung, Charakterkonsistenz und visueller Identitätsfixierung in jedem Frame.
Übertragen Sie Gesten, Tanz, Posen oder Kamerabewegungen aus einem Referenzvideo auf ein Standbildsubjekt bei 1080p.
Leichtere Referenzvideo-Bewegungsübertragung mit praktischen 720p- und 1080p-Ausgabepfaden bei geringeren Credit-Kosten.
Erstellen Sie Stilrahmen, Produktkonzepte, Thumbnails und visuelle Referenzen in bis zu 4K-Auflösung in unter 10 Sekunden.
Hintergrundtausch, Objektentfernung, Stiltransfer, Inpainting und Outpainting — nicht-destruktive Bearbeitung in bis zu 4K.
Spezifikationen aller Kling-Modelle nebeneinander. Die angezeigten Credits gelten für einen 5-Sekunden-Standardclip (720p 16:9, ohne Audio) — die tatsächlichen Kosten skalieren mit Auflösung, Dauer und Audio.
Nicht sicher, welches Modell Sie wählen sollen? Ordnen Sie Ihre kreative Aufgabe dem richtigen Kling-Modell zu.
Promptgeführtes Video aus Text oder Bild
Kling 3.0 ist das vielseitigste Videomodell — Text-zu-Video, Bild-zu-Video, Draft Mode für schnelle Iteration und physikalisch korrekte Bewegung aus einem einzigen Prompt.
Referenzgesteuertes Video mit Stilfixierung
Kling O3 bewahrt die visuelle Identität Ihres Referenzbildes in jedem Frame. Stil, Charakter und Komposition bleiben fixiert — kein Abdriften.
Bewegungsübertragung aus einem Referenzvideo
Laden Sie eine Tanz-, Gesten- oder Kamerabewegungsreferenz hoch und übertragen Sie diese Bewegung auf ein beliebiges Standbildsubjekt. Ganzkörpererfassung bei 1080p.
Referenzrahmen vor dem Video generieren
Erstellen Sie zuerst den Stilrahmen, das Produktkonzept oder die Charakterreferenz — speisen Sie es dann in Kling O3 oder Kling 3.0 für die Videogenerierung ein.
Häufige Fragen zur Auswahl zwischen Kling AI Modellen.