Skip to content

Humain numérique

POST
/kling/v1/videos/avatar/image2video

Générer une tâche vidéo d'humain numérique à partir d'une image de référence et d'un audio.

Authorizations

bearer
Type
HTTP (bearer)

Request Body

application/json
object

Image de référence pour l'humain numérique.
Prend en charge Base64 ou une URL d'image accessible.
Formats : .jpg / .jpeg / .png.
Taille max. 10 Mo ; largeur et hauteur ≥ 300 px ; rapport d'aspect entre 1:2,5 et 2,5:1.

ID audio généré par l'API d'écoute.
Audio créé dans les 30 jours, durée 2–300 s uniquement.
audio_id ou sound_file : l'un des deux, pas les deux ni aucun.

Fichier audio.
Prend en charge Base64 ou une URL audio accessible.
Formats : .mp3 / .wav / .m4a / .aac ; max. 5 Mo ; durée 2–300 s.
audio_id ou sound_file : l'un des deux, pas les deux ni aucun.

Invite textuelle positive

Mode de génération vidéo.
Valeurs : std, pro

URL de rappel à la fin de la tâche

ID de tâche externe (personnalisé)

Responses

OK

application/json

Playground

Authorization
Body

Samples