⚙️ Idéal pour l'Open Source

Générateur Gratuit de Prompts Stable Video Diffusion

Générez des prompts Stable Video Diffusion avec les paramètres de quantité de mouvement, fréquence d'images et conditionnement. Parfait pour les workflows ComfyUI, SD WebUI et déploiement local.

Voir : Comment ça marche

Voyez l'outil en action — exemple réel avec une sortie de prompt générée par IA.

Pourquoi choisir Stable Video Diffusion

⚙️

Entièrement open source

Les poids du modèle SVD sont disponibles gratuitement sur Hugging Face. Téléchargez, exécutez localement, fine-tunez et intégrez dans n'importe quel pipeline — sans abonnements, sans limites de taux, confidentialité totale.

🌞

Conditionnement par image

SVD fonctionne à partir d'une image de référence (première image), ce qui le rend idéal pour animer vos propres œuvres d'art, photos ou rendus. Le visuel de départ est toujours exactement ce que vous définissez.

🎮

Contrôle précis des paramètres

Contrôlez la quantité de mouvement avec motion_bucket_id, la fréquence d'images avec fps_id, et la force de conditionnement avec augmentation_level — sans approximations.

Qu'est-ce que Stable Video Diffusion ?

Stable Video Diffusion (SVD) est le modèle de génération vidéo open source de Stability AI. Contrairement aux modèles vidéo commerciaux qui s'exécutent dans le cloud, SVD peut être téléchargé et exécuté entièrement sur votre propre matériel — ce qui en fait le modèle de choix pour les développeurs, les chercheurs, les créateurs soucieux de leur vie privée et toute personne souhaitant un contrôle total sur son pipeline de génération vidéo.

SVD existe en deux variantes : le SVD original (14 images, jusqu'à 576×1024) et SVD-XT (25 images, même résolution). SVD-XT produit des animations plus longues et plus fluides et est généralement préféré lorsque le matériel le permet. Les deux modèles fonctionnent comme des générateurs image-vers-vidéo : vous fournissez une image de conditionnement comme première image, puis décrivez le mouvement que vous souhaitez lui appliquer.

Paramètres techniques SVD

Contrairement aux modèles vidéo axés sur le texte, le comportement de SVD est largement façonné par des paramètres numériques en plus d'une description de mouvement. Les comprendre vous donne un contrôle précis :

motion_bucket_id
Plage : 0–255. Contrôle la quantité globale de mouvement dans la sortie. Valeurs basses (0–40) = mouvement ambiant subtil. Moyennes (60–120) = mouvement naturel et modéré. Élevées (150–255) = mouvement dramatique et très énergique. La valeur par défaut est environ 127 pour des résultats équilibrés.
fps_id
Suggère la fréquence d'images pour l'interprétation du rythme de mouvement. Valeurs courantes : 6, 8, 12, 24. Des FPS plus bas rendent le mouvement plus saccadé ; des FPS plus élevés créent un mouvement plus fluide et continu. Cela ne modifie pas les FPS de lecture réels du fichier de sortie — cela affecte la distribution du mouvement sur les images.
augmentation_level
Plage : 0,0–1,0. Contrôle la quantité de bruit ajoutée à l'image de conditionnement. À 0, la sortie correspond étroitement à votre image de référence. Des valeurs plus élevées donnent au modèle plus de liberté pour s'écarter des détails visuels de l'image d'entrée. Utilisez 0,02–0,05 pour des résultats fidèles ; 0,1+ pour des variations créatives.

Points forts de SVD

Exemples de structures de prompts SVD

Scène naturelle — Sentier forestier

Reference frame: forest path in morning. Motion: gentle camera push-in along path, leaves swaying, light shifting through canopy. motion_bucket_id: 80, fps: 8, 3 seconds

Un motion_bucket_id modéré de 80 produit un mouvement ambiant naturel. Le déplacement de caméra combiné au mouvement environnemental (feuilles, lumière) crée un résultat cinématographique sans dramatiser excessivement la scène simple.

Portrait — Animation subtile

Reference frame: portrait of woman. Motion: subtle head turn right, hair movement, eyes blink naturally. motion_bucket_id: 40, fps: 12, 2 seconds

Un motion_bucket_id bas (40) est approprié pour les animations de portrait où vous souhaitez une subtilité réaliste plutôt qu'un mouvement exagéré. Des FPS plus élevés (12) rendent le mouvement facial et des cheveux fluide et naturel.

Paysage — Horizon océanique

Reference frame: ocean horizon. Motion: waves advancing and retreating, camera static, horizon stable. motion_bucket_id: 100, fps: 8, 4 seconds

Un motion_bucket_id plus élevé (100) est approprié pour le mouvement dynamique de l'eau. Indiquer explicitement « camera static, horizon stable » guide SVD pour concentrer l'énergie du mouvement sur les vagues plutôt que sur l'ensemble de l'image.

Conseils pour exécuter SVD localement

Questions Fréquentes

Qu'est-ce que Stable Video Diffusion ?

Stable Video Diffusion (SVD) est le modèle de génération vidéo open source de Stability AI. Il fonctionne principalement comme un modèle image-vers-vidéo : vous fournissez une image de conditionnement comme première image, et SVD génère les images suivantes en fonction du type de mouvement, des FPS et de la quantité de mouvement que vous spécifiez. Sa nature open source signifie que vous pouvez télécharger les poids, l'exécuter localement sur votre propre matériel et le fine-tuner pour des cas d'usage spécifiques.

Comment exécuter SVD localement ?

Les moyens les plus populaires pour exécuter SVD localement sont ComfyUI et le SD WebUI d'Automatic1111 avec l'extension SVD. Vous aurez besoin des poids de modèle SVD ou SVD-XT depuis Hugging Face, et d'un GPU avec au moins 8 Go de VRAM (16 Go recommandés pour SVD-XT en pleine résolution). ComfyUI est recommandé pour sa flexibilité de workflow basé sur les nœuds et son écosystème communautaire actif.

Que contrôle motion_bucket_id ?

motion_bucket_id est le paramètre principal pour contrôler la quantité de mouvement dans votre sortie SVD. Il accepte des valeurs de 0 à 255. Les valeurs basses (0–40) produisent un mouvement subtil et minimal — idéal pour les animations ambiantes douces. Les valeurs moyennes (60–120) produisent un mouvement naturel et modéré approprié pour la plupart des scènes. Les valeurs élevées (150–255) produisent une sortie dramatique et très mouvementée.

Quelle est la différence entre SVD et SVD-XT ?

SVD génère 14 images à une résolution maximale de 576x1024 pixels. SVD-XT (Extended) génère 25 images à la même résolution, produisant des clips plus longs et plus fluides. SVD-XT nécessite plus de VRAM et de temps de calcul. Les deux modèles acceptent les mêmes paramètres motion_bucket_id, fps_id et augmentation_level. SVD-XT est généralement préféré lorsque le matériel suffisant est disponible.

Essayez d'autres générateurs de prompts vidéo