WizardLM
Famille de grands modèles de langage open source optimisés par Evol-Instruct

WizardLM est une famille de grands modèles de langage open source conçue pour suivre des instructions complexes avec une qualité proche de celle des modèles propriétaires. Le projet répond au problème de la disponibilité de modèles capables de raisonner et d’exécuter des consignes élaborées sans dépendre d’API fermées, en mettant à disposition des poids librement réutilisables par la communauté.
Sa particularité technique tient à la méthode Evol-Instruct, qui consiste à faire évoluer automatiquement des instructions simples vers des variantes plus difficiles et plus diversifiées afin de constituer un jeu de données d’entraînement riche. Les modèles sont ensuite affinés sur ces instructions, ce qui améliore leur capacité à traiter des tâches de rédaction, de raisonnement et, pour certaines variantes spécialisées comme WizardCoder ou WizardMath, la programmation et les mathématiques. Les poids se déploient via les écosystèmes habituels tels que Hugging Face.
WizardLM s’adresse aux chercheurs, développeurs et entreprises souhaitant héberger leurs propres modèles, garder le contrôle de leurs données et personnaliser le comportement par fine-tuning. Parmi ses forces figurent la performance sur le suivi d’instructions et la flexibilité de l’open source. Ses limites tiennent aux ressources matérielles nécessaires pour l’inférence, à la variabilité des licences selon les versions et au fait que les performances restent en deçà des meilleurs modèles fermés sur certaines tâches.
Notes détaillées 3.6/5
Fonctionnalités clés
- Modèle généraliste de suivi d'instructions (WizardLM)
- Génération de code (WizardCoder)
- Résolution de problèmes mathématiques (WizardMath)
- Méthode Evol-Instruct pour générer des instructions complexes
- Conversations multi-tours (prompting style Vicuna)
- Tailles de modèles de 7B à 70B paramètres
👍 Avantages
- Entièrement open source et téléchargeable sur Hugging Face
- Performances élevées sur les benchmarks (HumanEval, GSM8k, MT-Bench)
- Plusieurs variantes spécialisées (code, maths)
- Certaines versions sous licence Llama 2 autorisant l'usage commercial
👎 Inconvénients
- Nécessite des compétences techniques et du matériel GPU pour le déploiement
- Pas d'interface ou d'application prête à l'emploi
- Certaines versions limitées à un usage académique/recherche
- Support multilingue limité (orienté anglais)
