Stable Beluga 2
Le grand modèle de langage 70B open de Stability AI

Stable Beluga 2 est un grand modèle de langage de 70 milliards de paramètres développé par Stability AI. Il s’agit d’une version affinée du modèle de fondation Llama 2 70B de Meta, optimisée pour le suivi d’instructions et la conversation en anglais. Conçu comme un assistant capable de répondre à des consignes complexes, il s’adresse principalement à la recherche et à l’expérimentation autour des modèles de langage open weight.
Le modèle repose sur un affinage supervisé (supervised fine-tuning) réalisé sur un jeu de données interne de style Orca, en deux phases. L’entraînement a employé une précision mixte BF16, l’optimiseur AdamW, un taux d’apprentissage de 3e-5 décroissant en cosinus, et des lots de 256 à 512. Il utilise un format de prompt structuré avec des balises Système, Utilisateur et Assistant. Le déploiement est possible via Transformers de Hugging Face, vLLM et SGLang (API compatibles OpenAI), Docker, ainsi que des versions quantifiées pour llama.cpp, Ollama et LM Studio.
Le public cible regroupe chercheurs, développeurs et passionnés d’IA souhaitant exécuter un modèle puissant localement. Ses forces tiennent à sa taille, à sa qualité de suivi d’instructions et à sa disponibilité en open weight. Ses limites notables incluent une licence non commerciale (recherche uniquement), un support limité à l’anglais, des besoins matériels lourds, et des risques de sorties inexactes, biaisées ou problématiques nécessitant des tests de sécurité.
Notes détaillées 3.6/5
Fonctionnalités clés
- Modèle de langage 70B affiné depuis Llama 2
- Suivi d'instructions et conversation
- Format de prompt structuré Système/Utilisateur/Assistant
- Déploiement via Transformers, vLLM et SGLang
- Versions quantifiées (llama.cpp, Ollama, LM Studio)
- Poids ouverts téléchargeables
👍 Avantages
- Modèle puissant de 70 milliards de paramètres
- Poids ouverts exécutables localement
- Bonne qualité de suivi d'instructions
- Multiples options de déploiement et de quantification
👎 Inconvénients
- Licence non commerciale (recherche uniquement)
- Support limité à l'anglais
- Besoins matériels très importants
- Peut produire des sorties inexactes ou biaisées
