Les classements de LLM publient un classement des LLM basé sur une variété de benchmarks. Les classements permettent de suivre la myriade de LLM et de comparer leurs performances. Les classements de LLM sont particulièrement utiles pour prendre des décisions quant aux modèles à utiliser.
Chaque benchmark dispose généralement de son propre classement, mais on trouve aussi des classements de LLM indépendants. Ainsi, Hugging Face dispose d’une collection de classements, dont un classement de LLM ouvert qui classe plusieurs modèles open source en fonction des benchmarks ARC, HellaSwag, MMLU, GSM8K, TruthfulQA et Winogrande.