Accueil les sujets À propos de la régression linéaire Qu’est-ce que la régression linéaire ?
Générer des prédictions à l’aide d’une formule mathématique facile à interpréter
Appliquer la régression linéaire avec watsonx.ai S’abonner aux actualités de l’IA
Illustration montrant la relation entre les tendances, l’analyse des données et la prévision dans la régression linéaire
Qu’est-ce que la régression linéaire ?

L’analyse de régression linéaire est utilisée pour prévoir la valeur d’une variable en fonction de la valeur d’une autre. La variable que vous souhaitez prévoir est appelée variable dépendante. La variable que vous utilisez pour prévoir la valeur de l’autre variable est appelée variable indépendante.

Cette forme d’analyse permet d’estimer les coefficients de l’équation linéaire, impliquant une ou plusieurs variables indépendantes qui prédisent le mieux la valeur de la variable dépendante. La régression linéaire permet d’ajuster une ligne droite ou une surface qui minimise les écarts entre les valeurs de sortie prédites et réelles. Il existe des calculateurs de régression linéaire simples qui utilisent une méthode de « moindres carrés » pour découvrir la ligne la plus adaptée à un ensemble de données appariées. Vous estimez ensuite la valeur de X (variable dépendante) à partir de Y (variable indépendante).

L’entrepôt de données pour l’IA

Découvrez la puissance de l’intégration d’une stratégie de data lakehouse dans votre architecture de données, y compris des améliorations pour dimensionner l’IA et des possibilités d’optimisation des coûts.

Contenu connexe

Obtenir le rapport IDC

Générer des prédictions plus facilement

Vous pouvez effectuer une régression linéaire dans Microsoft Excel ou utiliser des logiciels statistiques comme IBM SPSS Statistics qui simplifient considérablement le processus d’utilisation des équations de régression linéaire, des modèles de régression linéaire et de la formule de régression linéaire. SPSS Statistics peut être utilisé dans des techniques comme la régression linéaire simple et la régression linéaire multiple.

Vous pouvez appliquer la méthode de régression linéaire dans divers programmes et environnements, notamment :

  • Régression linéaire R.
  • Régression linéaire MATLAB.
  • Régression linéaire Sklearn.
  • Régression linéaire Python.
  • Régression linéaire Excel.
Pourquoi la régression linéaire est importante

Les modèles de régression linéaire sont relativement simples et fournissent une formule mathématique facile à interpréter qui peut générer des prédictions. La régression linéaire peut être appliquée à divers domaines dans les affaires et les études universitaires.

Vous constaterez que la régression linéaire est utilisée dans tous les domaines, des sciences biologiques, comportementales, environnementales et sociales aux affaires. Les modèles de régression linéaire sont devenus un moyen éprouvé de prédire l’avenir scientifiquement et de manière fiable. La régression linéaire étant une procédure statistique établie de longue date, les propriétés des modèles de régression linéaire sont bien comprises et peuvent être entraînées très rapidement.

Un moyen éprouvé de prédire l’avenir scientifiquement et de manière fiable

Les techniques de régression linéaire améliorent la prise de décision des dirigeants d’entreprise et responsables d’organisation. À partir des masses de données collectées, la régression linéaire les aide à exploiter ces données pour mieux gérer la réalité, au lieu de se fier à l’expérience et à l’intuition. Vous pouvez ainsi transformer des quantités considérables de données brutes en informations exploitables.

La régression linéaire permet aussi d’obtenir des informations de valeur en découvrant des schémas et des relations que vos collègues ont pu voir auparavant en pensant les avoir compris. Par exemple, l’analyse des données de ventes et d’achats peut vous aider à découvrir des habitudes d’achat spécifiques à certains jours ou à certaines heures. Les informations recueillies grâce à l’analyse de régression permettent ainsi aux chefs d’entreprise d’anticiper les périodes où les produits de leur société seront très demandés.

En savoir plus sur la régression linéaire avec IBM Knowledge Center
Principales hypothèses d’une régression linéaire efficace

Hypothèses à prendre en compte pour réussir une analyse de régression linéaire :

  • Pour chaque variable : tenez compte du nombre de cas valides, de la moyenne et de l’écart type. 
  • Pour chaque modèle : examinez les coefficients de régression, la matrice de corrélation, les corrélations de parties et partiales, le R multiple, le R2, le R2 ajusté, la variation du R2, l’erreur standard de l’estimation, le tableau d’analyse de variance, les valeurs prédites et les résidus. Prenez également en compte les intervalles de fiabilité à 95 % pour chaque coefficient de régression, la matrice de variance-covariance, le facteur d’inflation de la variance, la tolérance, le test de Durbin-Watson, les mesures de distance (Mahalanobis, Cook et valeurs à effet de levier), DfBeta, DfFit, les intervalles de prédiction et les informations de diagnostic au cas par cas. 
  • Graphiques : examinez les nuages de points, les graphiques partiels, les histogrammes et les graphiques de probabilité normale.
  • Données : les variables dépendantes et indépendantes doivent être quantitatives. Les variables catégorielles, comme la religion, le principal domaine d’études ou la région de résidence, doivent être recodées en variables binaires (factices) ou en d’autres types de variables de contraste. 
  • Autres hypothèses : pour chaque valeur de la variable indépendante, la distribution de la variable dépendante doit être normale. La variance de la distribution de la variable dépendante doit être constante pour toutes les valeurs de la variable indépendante. La relation entre la variable dépendante et chaque variable indépendante doit être linéaire et toutes les observations doivent être indépendantes.
Essayer gratuitement SPSS Statistics
Assurez-vous que vos données répondent aux hypothèses de régression linéaire

Avant d’effectuer une régression linéaire, vous devez vous assurer que vos données peuvent être analysées à l’aide de cette procédure. Vos données doivent passer par certaines hypothèses requises.

Voici comment vérifier ces hypothèses :

  1. Les variables doivent être mesurées de manière continue. Le temps, les ventes, le poids et les résultats des tests sont des exemples de variables continues. 
  2. Utilisez un nuage de points pour déterminer rapidement s’il existe une relation linéaire entre ces deux variables.
  3. Les observations doivent être indépendantes les unes des autres (c’est-à-dire qu’il ne doit pas y avoir de dépendance).
  4. Vos données ne doivent pas présenter de valeurs aberrantes significatives. 
  5. Vérifier l’homoscédasticité, un concept statistique selon lequel les variances le long de la ligne de régression linéaire la mieux ajustée restent égales tout au long de cette ligne.
  6. Les valeurs résiduelles (erreurs) de la ligne de régression la plus adaptée suivent la distribution normale.
Ce tutoriel pratique vous permettra d’en savoir plus sur les hypothèses de régression linéaire
Exemples de régression linéaire réussie
Évaluer les tendances et les estimations des ventes

Vous pouvez également utiliser l’analyse de régression linéaire pour tenter de prédire les ventes annuelles totales d’un vendeur (la variable dépendante) à partir de variables indépendantes telles que l’âge, la formation et les années d’expérience.

Analyser l’élasticité des prix

Les changements de prix ont souvent une incidence sur le comportement des consommateurs, et la régression linéaire peut vous aider à analyser cet impact. Par exemple, si le prix d’un produit particulier change constamment, l’analyse de régression vous permet de voir si la consommation diminue lorsque le prix augmente. Que se passe-t-il si la consommation ne diminue pas de manière significative lorsque le prix augmente ? À partir de quel prix les acheteurs cessent-ils d’acheter le produit ? Ces informations sont très utiles aux dirigeants du commerce de détail.

Évaluer les risques dans une compagnie d’assurance

Les techniques de régression linéaire peuvent être utilisées pour l’analyse de risque. Par exemple, une compagnie d’assurance peut disposer de ressources limitées pour examiner les demandes d’indemnisation des propriétaires ; grâce à la régression linéaire, l’équipe de la compagnie peut construire un modèle d’estimation des coûts des demandes d’indemnisation. L’analyse peut ainsi aider les chefs d’entreprise à prendre des décisions importantes sur les risques à prendre.

Analyse dans le sport

La régression linéaire ne concerne pas toujours les entreprises. Elle est également importante dans le domaine du sport. Par exemple, vous pouvez vous demander si le nombre de matchs gagnés par une équipe de basket-ball au cours d’une saison est lié au nombre moyen de points marqués par l’équipe par match. Un nuage de points indique que ces variables sont liées de manière linéaire. Le nombre de matchs gagnés et le nombre moyen de points marqués par l’adversaire sont également liés de manière linéaire. Ces variables ont une relation négative. Plus le nombre de matchs gagnés augmente, plus le nombre moyen de points marqués par l’adversaire diminue. La régression linéaire permet de modéliser la relation entre ces variables. Un bon modèle peut ainsi permettre de prédire le nombre de matchs que les équipes gagneront.

Solutions connexes
Logiciel IBM SPSS Statistics

Faites avancer la recherche et l’analyse grâce à cette solution rapide et puissante.

Découvrir SPSS Statistics
IBM SPSS Statistics Grad Pack et Faculty Packs

Les étudiants, les enseignants et les chercheurs bénéficient d’un accès abordable aux logiciels d’analyse prédictive.

Découvrir SPSS Statistics Grad Pack et Faculty Packs Essayer gratuitement SPSS Statistics
IBM Cognos Analytics

Cette solution analytique en libre-service éprouvée vous permet de combiner vos données et de créer des visualisations attrayantes.

Découvrir Cognos Software
Ressources Les détails de la régression linéaire dans IBM Knowledge Center Un exemple simple de régression linéaire dans un tutoriel gratuit Comment utiliser la régression linéaire pour modéliser les ventes de véhicules Méthodes de sélection des variables de régression linéaire A propos des règles de régression linéaire définies Statistiques de régression linéaire Graphiques de régression linéaire Méthodes de sélection des variables de régression linéaire Enregistrer les nouvelles variables, les valeurs prévues, les résidus et autres statistiques Régression linéaire à partir de zéro

Découvrez comment transformer les mathématiques en code, puis exécuter le code sur un ensemble de données pour obtenir des prédictions sur de nouvelles données.

Régression linéaire dans R

Création et validation de modèles de régression linéaire avec R.

Passez à l’étape suivante

IBM SPSS Statistics offre des analyses statistiques avancées, une vaste bibliothèque d’algorithmes de machine learning, l’analyse de texte, l’extensibilité open source, l’intégration Big Data et un déploiement transparent dans les applications.

Découvrir SPSS Statistics Essai gratuit de 30 jours