ChatGLM-6B

Modèle de dialogue bilingue open source déployable localement

ChatGLM-6B est un grand modèle de langage conversationnel open source développé par l’équipe de recherche de l’université Tsinghua (THUDM), en Chine. Fondé sur l’architecture GLM, il compte environ 6,2 milliards de paramètres et est conçu pour générer des réponses de dialogue bilingues en chinois et en anglais. Son objectif principal est de rendre un assistant conversationnel accessible localement, sans dépendre d’une API distante, y compris sur du matériel grand public.

Le modèle a été entraîné sur environ mille milliards de jetons de données bilingues, puis affiné par apprentissage supervisé et renforcement avec retour humain pour produire des réponses contextuelles sur plusieurs tours. Il prend en charge la quantification INT8 et INT4, cette dernière ne nécessitant que 6 Go de mémoire vidéo, contre 13 Go en FP16. Il propose un affinage efficace via P-Tuning v2, une exécution sur CPU, multi-GPU ou Mac (backend MPS), ainsi que des interfaces web Gradio et des points d’accès API REST. Le code est sous licence Apache-2.0.

Il s’adresse aux développeurs, chercheurs et entreprises souhaitant déployer un modèle de dialogue localement. Ses forces sont l’accessibilité matérielle, le bilinguisme et l’ouverture, avec usage commercial possible après enregistrement. Ses limites, reconnues par les auteurs, incluent des connaissances factuelles faibles, un raisonnement logique et mathématique limité, des biais possibles et une sensibilité aux prompts trompeurs. Le dépôt signale que des modèles plus récents (GLM-4) lui succèdent désormais.

Notes détaillées 3.5/5

Personnalisation et flexibilité 4

Intégrations 3

Interface utilisateur 2.5

Performance et fiabilité 3

Tarif (rapport qualité-prix) 5

Mon expérience 3.5

Fonctionnalités clés

Dialogue bilingue chinois et anglais
Quantification INT4 et INT8 (6 Go de VRAM en INT4)
Affinage efficace via P-Tuning v2
Inference sur CPU, multi-GPU et Mac (MPS)
Interface web Gradio et API REST
Déploiement local sur matériel grand public

👍 Avantages

Totalement open source (licence Apache-2.0)
Accessible sur GPU grand public grâce à la quantification
Bilingue chinois/anglais
Usage commercial autorisé après enregistrement

👎 Inconvénients

Connaissances factuelles et raisonnement logique limités
Performances faibles en mathématiques et programmation
Sensible aux prompts trompeurs et aux biais
Remplacé par des modèles plus récents (GLM-4)

Notes détaillées 3.5/5

Fonctionnalités clés

👍 Avantages

👎 Inconvénients

Articles tendance