Comment calculer la somme des carrés pour erreur (sse)

La somme des erreurs carrées, ou SSE, est un calcul statistique préliminaire qui conduit à d`autres valeurs de données. Lorsque vous avez un ensemble de valeurs de données, il est utile de pouvoir trouver à quel point ces valeurs sont étroitement liées. Vous devez obtenir vos données organisées dans une table, puis effectuer des calculs assez simples. Une fois que vous avez trouvé le SSE pour un ensemble de données, vous pouvez ensuite continuer à trouver la variance et la déviation type.

Pas

Méthode 1 de 3:
Calcul de la SSE à la main
  1. Image intitulée Calculez la somme des carrés pour erreur (SSE) Étape 1
1. Créer une table à trois colonnes. Le moyen le plus clair de calculer la somme des erreurs carrées est de commencer par une table à trois colonnes. Étiquetez les trois colonnes comme Valeur{ displaystyle { text {valeur}}}{ text {valeur}}, Déviation{ displaystyle { texte {déviation}}}{ texte {déviation}}, et Déviation2{ displaystyle { text {déviation}} ^ {2}}{ texte {déviation}} ^ {2}.
  • Image intitulée Calculez la somme des carrés pour erreur (SSE) Étape 2
    2. Remplir les données. La première colonne conserve les valeurs de vos mesures. Remplir Valeur{ displaystyle { text {valeur}}}{ text {valeur}} colonne avec les valeurs de vos mesures. Ceux-ci peuvent être les résultats de certaines expériences, une étude statistique ou juste des données fournies pour un problème de mathématiques.
  • Dans ce cas, supposons que vous travailliez avec certaines données médicales et que vous avez une liste des températures corporelles de dix patients. La température corporelle normale attendue est de 98.6 degrés. Les températures de dix patients sont mesurées et donnent les valeurs 99.0, 98.6, 98.5, 101.1, 98.3, 98.6, 97.9, 98.4, 99.2, et 99.1. Écrivez ces valeurs dans la première colonne.
  • Image intitulée Calculez la somme des carrés pour erreur (SSE) Étape 3
    3. Calculer la moyenne. Avant de pouvoir calculer l`erreur pour chaque mesure, vous devez calculer la moyenne de l`ensemble de données complète.
  • Rappelons que la moyenne de tout ensemble de données est la somme des valeurs, divisée par le nombre de valeurs dans l`ensemble. Cela peut être représenté symboliquement, avec la variable μ{ displaystyle mu} mu représentant la moyenne, comme:
  • μEnglisonsΣXn{ displaystyle mu = { frac { sigma x} {n}}} mu = { frac { sigma x} {n}}
  • Pour ces données, la moyenne est calculée comme suit:
  • μEnglisons99.0+98.6+98.5+101.1+98.3+98.6+97.9+98.4+99.2+99.1dix{ displaystyle mu = { frac {99.0 + 98.6 + 98.5 + 101.1 + 98.3 + 98.6 + 97.9 + 98.4 + 99.2 + 99.1} {10}}} mu = { frac {99.0 + 98.6 + 98.5 + 101.1 + 98.3 + 98.6 + 97.9 + 98.4 + 99.2 + 99.1} {10}}
  • μEnglisons988.7dix{ displaystyle mu = { frac {988.7} {10}}} mu = { frac {988.7} {10}}
  • μEnglisons98.87{ displaystyle mu = 98.87} mu = 98.87
  • Image intitulée Calculez la somme des carrés pour erreur (SSE) Étape 4
    4. Calculer les mesures d`erreur individuelles. Dans la deuxième colonne de votre table, vous devez remplir les mesures d`erreur pour chaque valeur de données. L`erreur est la différence entre la mesure et la moyenne.
  • Pour le jeu de données donné, soustrayez la moyenne, 98.87, de chaque valeur mesurée et remplissez la deuxième colonne avec les résultats. Ces dix calculs sont les suivants:
  • 99.0-98.87Englisons0.13{ displaystyle 99.0-98.87 = 0.13}99.0-98.87 = 0.13
  • 98.6-98.87Englisons-0.27{ displaystyle 98.6-98.87 = -0.27}98.6-98.87 = -0,27
  • 98.5-98.87Englisons-0.37{ displaystyle 98.5-98.87 = -0.37}98.5-98.87 = -0,37
  • 101.1-98.87Englisons2.23{ displaystyle 101.1-98.87 = 2.23}101.1-98.87 = 2.23
  • 98.3-98.87Englisons-0.57{ displaystyle 98.3-98.87 = -0.57}98.3-98.87 = -0.57
  • 98.6-98.87Englisons-0.27{ displaystyle 98.6-98.87 = -0.27}98.6-98.87 = -0,27
  • 97.9-98.87Englisons-0.97{ displaystyle 97.9-98.87 = -0.97}97.9-98.87 = -0,97
  • 98.4-98.87Englisons-0.47{ displaystyle 98.4-98.87 = -0.47}98.4-98.87 = -0.47
  • 99.2-98.87Englisons0.33{ displaystyle 99.2-98.87 = 0.33}99.2-98.87 = 0,33
  • 99.1-98.87Englisons0.23{ displaystyle 99.1-98.87 = 0.23}99.1-98.87 = 0,23
  • Image intitulée Calculez la somme des carrés pour erreur (SSE) Étape 5
    5. Calculer les carrés des erreurs. Dans la troisième colonne de la table, trouvez le carré de chacune des valeurs résultantes dans la colonne du milieu. Celles-ci représentent les carrés de la déviation par rapport à la moyenne de chaque valeur mesurée des données.
  • Pour chaque valeur dans la colonne du milieu, utilisez votre calculatrice et trouvez le carré. Enregistrez les résultats dans la troisième colonne, comme suit:
  • 0.132Englisons0.0169{ displaystyle 0.13 ^ {2} = 0.0169}0,13 ^ ^ {2} = 0.0169
  • (-0.27)2Englisons0.0729{ displaystyle (-0.27) ^ {2} = 0.0729}(-0,27) ^ {2} = 0.0729
  • (-0.37)2Englisons0.1369{ displaystyle (-0.37) ^ {2} = 0.1369}(-0,37) ^ {2} = 0.1369
  • 2.232Englisons4.9729{ displaystyle 2.23 ^ {2} = 4.9729}2.23 ^ {2} = 4.9729
  • (-0.57)2Englisons0.3249{ displaystyle (-0.57) ^ {2} = 0.3249}(-0.57) ^ {2} = 0.3249
  • (-0.27)2Englisons0.0729{ displaystyle (-0.27) ^ {2} = 0.0729}(-0,27) ^ {2} = 0.0729
  • (-0.97)2Englisons0.9409{ displaystyle (-0.97) ^ {2} = 0.9409}(-0,97) ^ {2} = 0.9409
  • (-0.47)2Englisons0.2209{ displaystyle (-0.47) ^ {2} = 0.2209}(-0,47) ^ {2} = 0,2209
  • 0.332Englisons0.1089{ displaystyle 0.33 ^ {2} = 0.1089}0.33 ^ {2} = 0.1089
  • 0.232Englisons0.0529{ displaystyle 0.23 ^ {2} = 0.0529}0,23 ^ {2} = 0,0529
  • Image intitulée Calculez la somme des carrés pour erreur (SSE) Étape 6
    6. Ajouter les carrés d`erreurs ensemble. La dernière étape consiste à trouver la somme des valeurs dans la troisième colonne. Le résultat souhaité est le SSE ou la somme des erreurs carrées.
  • Pour ce jeu de données, la SSE est calculée en ajoutant ensemble les dix valeurs de la troisième colonne:
  • SSEEnglisons6.921{ displaystyle SSE = 6.921}SSE = 6.921
  • Méthode 2 de 3:
    Créer une feuille de calcul Excel pour calculer SSE
    1. Image intitulée Calculez la somme des carrés pour erreur (SSE) Étape 7
    1. Étiquetez les colonnes de la feuille de calcul. Vous créerez une table à trois colonnes dans Excel, avec les mêmes titres que ci-dessus.
    • Dans la cellule A1, tapez la valeur "Valeur."
    • Dans la cellule B1, entrez dans la rubrique "Déviation."
    • Dans la cellule C1, entrez dans la rubrique "Déviation Squared."
  • Image intitulée Calculez la somme des carrés pour erreur (SSE) Étape 8
    2. Entrez vos données. Dans la première colonne, vous devez saisir les valeurs de vos mesures. Si l`ensemble est petit, vous pouvez simplement les saisir à la main. Si vous avez un ensemble de données volumineux, vous devrez peut-être copier et coller les données dans la colonne.
  • Image intitulée Calculez la somme des carrés pour erreur (SSE) Étape 9
    3. Trouver la moyenne des points de données. Excel a une fonction qui calculera la moyenne pour vous. Dans une cellule vacante située sous votre table de données (cela n`a pas d`importance de choisir la cellule), entrez les suivantes:
  • = Moyenne (A2: ___)
  • Ne tapez pas réellement un espace vide. Remplissez ce vide avec le nom de la cellule de votre dernier point de données. Par exemple, si vous avez 100 points de données, vous utiliserez la fonction:
  • = Moyenne (A2: A101)
  • Cette fonction inclut des données d`A2 via A101 car la rangée supérieure contient les en-têtes des colonnes.
  • Lorsque vous appuyez sur ENTER ou lorsque vous cliquez sur une autre cellule de la table, la moyenne de vos valeurs de données remplira automatiquement la cellule que vous venez de programmer.
  • Image intitulée Calculez la somme des carrés pour erreur (SSE) Étape 10
    4. Entrez la fonction pour les mesures d`erreur. Dans la première cellule vide de la colonne "Déviation", vous devez entrer une fonction pour calculer la différence entre chaque point de données et la moyenne. Pour ce faire, vous devez utiliser le nom de la cellule où la moyenne réside. Supposons maintenant que vous avez utilisé Cell A104.
  • La fonction du calcul d`erreur, que vous entrez dans la cellule B2, sera la suivante:
  • = A2- $ A 104 $.Les panneaux de dollar sont nécessaires pour vous assurer de verrouiller la cellule A104 pour chaque calcul.
  • Image intitulée Calculez la somme des carrés pour erreur (SSE) Étape 11
    5. Entrez la fonction pour les carrés d`erreur. Dans la troisième colonne, vous pouvez diriger Excel pour calculer la place dont vous avez besoin.
  • Dans la cellule C2, entrez la fonction
  • = B2 ^ 2
  • Image intitulée Calculez la somme des carrés pour erreur (SSE) Étape 12
    6. Copiez les fonctions pour remplir la table entière. Une fois que vous avez entré les fonctions dans la cellule supérieure de chaque colonne, B2 et C2 respectivement, vous devez remplir la table complète. Vous pouvez retaper la fonction dans toutes les lignes de la table, mais cela prendrait beaucoup trop de temps. Utilisez votre souris, mettez en surbrillance les cellules B2 et C2 ensemble et sans laisser aller du bouton de la souris, faites-le glisser vers la cellule inférieure de chaque colonne.
  • Si nous supposons que vous disposez de 100 points de données dans votre table, vous allez glisser votre souris sur les cellules B101 et C101.
  • Lorsque vous relâchez le bouton de la souris, les formules seront copiées dans toutes les cellules de la table. La table doit être automatiquement remplie avec les valeurs calculées.
  • Image intitulée Calculez la somme des carrés pour erreur (SSE) Étape 13
    7. Trouver le SSE. La colonne C de votre table contient toutes les valeurs d`erreur carrée. La dernière étape consiste à avoir Excel calculer la somme de ces valeurs.
  • Dans une cellule sous la table, probablement C102 pour cet exemple, entrez la fonction:
  • = Somme (C2: C101)
  • Lorsque vous cliquez sur Entrée ou cliquez sur toute autre cellule de la table, vous devez avoir la valeur SSE pour vos données.
  • Méthode 3 sur 3:
    Relier SSE à d`autres données statistiques
    1. Image intitulée Calculez la somme des carrés pour erreur (SSE) Étape 14
    1. Calculer la variance de SSE. Trouver le SSE pour un ensemble de données est généralement un élément de construction pour trouver d`autres valeurs plus utiles, plus utiles. Le premier de ceux-ci est la variance. La variance est une mesure indiquant combien les données mesurées varient de la moyenne. C`est en fait la moyenne des différences carrées de la moyenne.
    • Parce que la SSE est la somme des erreurs carrées, vous pouvez trouver la moyenne (qui est la variance), juste en divisant par le nombre de valeurs. Cependant, si vous calculez la variance d`un ensemble d`échantillons, plutôt qu`une population totale, vous diviserez par (N-1) au lieu de n. Ainsi:
    • Variance = SSE / N, si vous calculez la variance d`une population totale.
    • Variance = SSE / (N-1), si vous calculez la variance d`un exemple de données de données.
  • Pour le problème d`échantillon des températures des patients, nous pouvons supposer que 10 patients ne représentent qu`un ensemble d`échantillons. Par conséquent, la variance serait calculée comme suit:
  • VarianceEnglisonsSSE(n-1){ displaystyle { texte {variance}} = { frac { text {sse}} {(n-1)}}}{ text {variance}} = { frac { text {sse}}} {(n-1)}}}
  • VarianceEnglisons6.9219{ displaystyle { texte {variance}}} = { frac {6.921} {9}}}{ Text {variance}} = { frac {6.921} {9}}
  • VarianceEnglisons0.769{ displaystyle { text {variance}} = 0.769}{ texte {variance}} = 0.769
  • Image intitulée Calculez la somme des carrés pour erreur (SSE) Étape 15
    2. Calculer l`écart type de SSE. L`écart type est une valeur couramment utilisée qui indique à quel point les valeurs de tout ensemble de données s`écartent de la moyenne. La déviation standard est la racine carrée de la variance. Rappelez-vous que la variance est la moyenne des mesures d`erreur carrée.
  • Par conséquent, après avoir calculé l`ESS, vous pouvez trouver l`écart type comme suit:
  • Écart-typeEnglisonsSSEn-1{ displaystyle { text {écart type}} = { sqrt { frac { text {sse}} {n-1}}}}{ text {écart type}} = { sqrt {{ frac {{ text {sse}}} {n-1}}}}
  • Pour l`échantillon de données des mesures de température, vous pouvez trouver l`écart type comme suit:
  • Écart-typeEnglisonsSSEn-1{ displaystyle { text {écart type}} = { sqrt { frac { text {sse}} {n-1}}}}{ text {écart type}} = { sqrt {{ frac {{ text {sse}}} {n-1}}}}
  • Écart-typeEnglisons6.9219{ displaystyle { text {écart type}} = { sqrt { frac { texte {6.921}} {9}}}}{ text {écart type}} = { sqrt {{ frac {{ text {6.921}}} {9}}}}
  • Écart-typeEnglisons.769{ displaystyle { texte {déviation standard}} = { sqrt {.769}}}{ Text {déviation standard}} = { sqrt {.769}}
  • Écart-typeEnglisons0.877{ displaystyle { text {écart type}} = 0.877}{ texte {écart type}} = 0,877
  • Image intitulée Calculez la somme des carrés pour erreur (SSE) Étape 16
    3. Utilisez SSE pour mesurer la covariance. Cet article s`est concentré sur les ensembles de données qui ne mesurent qu`une seule valeur à la fois. Cependant, dans de nombreuses études, vous pouvez comparer deux valeurs distinctes. Vous voudriez savoir comment ces deux valeurs se rapportent les unes aux autres, non seulement à la moyenne de l`ensemble de données. Cette valeur est la covariance.
  • Les calculs de la covariance sont trop impliqués pour détailler ici, autrement que de noter que vous utiliserez l`ESS pour chaque type de données, puis de les comparer. Pour une description plus détaillée de la covariance et des calculs impliqués, voir Calculer la covariance.
  • À titre d`exemple de l`utilisation de la covariance, vous voudrez peut-être comparer les âges des patients dans une étude médicale à l`efficacité d`un médicament dans la réduction des températures de fièvre. Ensuite, vous auriez un ensemble de données d`âges et un deuxième ensemble de données de températures. Vous trouverez la SSE pour chaque ensemble de données, puis de là trouver la variance, les écarts types et la covariance.
  • Conseils

    Articles connexes