Stable Diffusion
Le modèle open source de référence pour générer des images

Stable Diffusion est un modèle d’IA générative de type diffusion latente, capable de produire des images à partir de descriptions textuelles. Développé pour démocratiser la génération d’images, il se distingue par son caractère ouvert, qui permet de l’exécuter localement et de le personnaliser librement. Il répond au besoin de créer des visuels originaux sans recourir exclusivement à des services propriétaires fermés.
Son fonctionnement repose sur un processus de débruitage progressif : à partir d’un bruit aléatoire et guidé par un prompt textuel, le modèle reconstruit pas à pas une image cohérente. Il prend en charge la génération à partir de texte, mais aussi la transformation d’images existantes, le remplissage de zones ou l’extension d’images. Grâce à son ouverture, il bénéficie d’un vaste écosystème d’interfaces, d’extensions, de modèles affinés et de techniques comme les LoRA ou ControlNet pour un contrôle précis du rendu.
Stable Diffusion s’adresse aux artistes, développeurs, chercheurs et amateurs souhaitant un contrôle approfondi sur la création d’images. Ses forces résident dans sa flexibilité, sa gratuité d’usage en local et sa communauté très active. Ses limites concernent les exigences matérielles pour un usage local, une qualité dépendante du modèle et des prompts, ainsi que des enjeux juridiques et éthiques liés aux données d’entraînement et aux usages.
Notes détaillées 4/5
Fonctionnalités clés
- Génération d'images à partir de texte (text-to-image)
- Édition et retouche d'images guidées par prompt
- Poids de modèles téléchargeables et auto-hébergeables
- API cloud facturée au crédit
- Plateforme gérée Brand Studio pour les équipes
- Routage de modèles et contrôles de précision
👍 Avantages
- Modèle open source auto-hébergeable et gratuit sous certains seuils
- Large écosystème communautaire et outils tiers
- API et plateforme gérée pour les usages professionnels
- Forte personnalisation (fine-tuning, contrôle des paramètres)
👎 Inconvénients
- Auto-hébergement exigeant techniquement (GPU, configuration)
- Licence commerciale payante au-delà d'un million de dollars de revenus
- Interface et prompts essentiellement en anglais
- Qualité dépendante du modèle et du prompt utilisés
