Beregn summen af ​​firkanter (SSE)

Forfatter: Charles Brown
Oprettelsesdato: 9 Februar 2021
Opdateringsdato: 1 Juli 2024
Anonim
11 ii. Sum of Square Error using scientific calculator. SSE, SST
Video.: 11 ii. Sum of Square Error using scientific calculator. SSE, SST

Indhold

Summen af ​​firkanter eller SSE er en foreløbig statistisk beregning, der fører til forskellige dataværdier. Når du har et sæt dataværdier, er det nyttigt at kunne bestemme, hvor tæt disse værdier er. Du skal organisere dine data i en tabel og derefter udføre forholdsvis enkle beregninger. Når du har fundet SSE for et datasæt, kan du derefter finde variansen og standardafvigelsen.

At træde

Metode 1 af 3: Beregn SSE manuelt

  1. Opret en tre-kolonnetabel. Den klareste måde at beregne SSE på er at starte med en tre kolonnetabel. Mærk de tre kolonner Værdi{ displaystyle { text {Value}}}Udfyld detaljerne. Den første kolonne indeholder værdierne for dine målinger. Udfyld kolonnen Værdi{ displaystyle { text {Value}}}Beregn gennemsnittet. Inden du kan beregne fejlen for hver måling, skal du beregne gennemsnittet af hele datasættet.
    • Gennemsnittet af et datasæt er summen af ​​værdierne divideret med antallet af værdier i sættet. Dette kan repræsenteres symbolsk med variablen μ{ displaystyle mu}Beregn de individuelle fejlværdier. I den anden kolonne i din tabel skal du indtaste fejlværdierne for hver dataværdi. Fejlen er forskellen mellem målingen og gennemsnittet.
      • For det givne datasæt skal du trække gennemsnittet, 98,87, fra hver målte værdi og udfylde den anden kolonne med resultaterne. Disse ti beregninger går som følger:
        • 99,098,87=0,13{ displaystyle 99.0-98.87 = 0.13}Beregn SSE. I den tredje kolonne i tabellen skal du finde firkanten af ​​hver af de resulterende værdier i den midterste kolonne. Disse repræsenterer kvadraterne for afvigelsen fra gennemsnittet for hver målte dataværdi.
          • For hver værdi i den midterste kolonne skal du bruge en lommeregner til at beregne firkanten. Optag resultaterne i tredje kolonne som følger:
            • 0,132=0,0169{ displaystyle 0.13 ^ {2} = 0.0169}Læg firkanterne for fejlene sammen. Det sidste trin er at finde summen af ​​værdierne i den tredje kolonne. Det ønskede resultat er SSE eller summen af ​​kvadraterne for fejlene.
              • For dette datasæt beregnes SSE ved at tilføje de ti værdier i den tredje kolonne:
              • S.S.E=6,921{ displaystyle SSE = 6.921}Mærk kolonnerne i regnearket. Du opretter en tabel med tre kolonner i Excel med de samme tre overskrifter som ovenfor.
                • Skriv "Værdi" som overskrift i celle A1.
                • Skriv "Afvigelse" som overskrift i felt B1.
                • I felt C1 skal du skrive "Afvigelse i kvadrat" som overskrift.
              • Indtast dine oplysninger. I den første kolonne skal du indtaste værdierne for dine målinger. Hvis sættet er lille, kan du nemt skrive det i hånden. Hvis du har et stort datasæt, skal du muligvis kopiere og indsætte dataene i kolonnen.
              • Bestem gennemsnittet af datapunkterne. Excel har en funktion, der beregner gennemsnittet for dig. I en tom celle under din datatabel (det betyder ikke noget, hvilken celle du vælger), skal du indtaste følgende:
                • = Gennemsnit (A2: ___)
                • Indtast ikke blank plads. Udfyld dette mellemrum med cellenavnet på dit sidste datapunkt. For eksempel, hvis du har 100 datapunkter, vil du bruge funktionen:
                  • = Gennemsnit (A2: A101)
                  • Denne funktion indeholder dataene fra cellerne A2 til og med A101, fordi den øverste række indeholder kolonneoverskrifterne.
                • Når du trykker på Enter, eller når du klikker på en anden celle i tabellen, udfyldes den nyprogrammerede celle automatisk med gennemsnittet af dine dataværdier.
              • Indtast funktionen til fejlmålingerne. I den første tomme celle i kolonnen "Afvigelse" skal du indtaste en funktion for at beregne forskellen mellem hvert datapunkt og middelværdien. For at gøre dette skal du bruge cellenavnet, hvor gennemsnittet er placeret. Lad os antage, at du har brugt celle A104 indtil videre.
                • Fejlberegningsfunktionen, som du indtaster i celle B2, er:
                  • = A2- $ A $ 104. Dollartegnene er nødvendige for at sikre, at du låser boks A104 til enhver beregning.
              • Indtast funktionen for de kvadrerede fejl. I den tredje kolonne kan du instruere Excel om at beregne den ønskede firkant.
                • Indtast følgende funktion i celle C2:
                  • = B2 ^ 2
              • Kopier funktionerne for at udfylde hele tabellen. Når du har indtastet funktionerne i den øverste celle i hver kolonne, henholdsvis B2 og C2, skal du udfylde hele tabellen. Du kan indtaste funktionen igen i en hvilken som helst linje i tabellen, men det vil tage alt for lang tid. Brug musen til at fremhæve cellerne B2 og C2 sammen, og uden at slippe museknappen skal du trække til den nederste celle i hver kolonne.
                • Forudsat at du har 100 datapunkter i din tabel, skal du trække musen til cellerne B101 og C101.
                • Når du slipper museknappen, kopieres formlerne til alle celler i tabellen. Tabellen skal automatisk udfyldes med de beregnede værdier.
              • Find SSE. Kolonne C i din tabel indeholder alle kvadratiske fejlværdier. Det sidste trin er at lade Excel beregne summen af ​​disse værdier.
                • Indtast følgende funktion i en celle under tabellen, sandsynligvis C102 i dette eksempel:
                  • = Sum (C2: C101)
                • Hvis du klikker på Enter eller klikker væk i en anden celle i tabellen, får du SSE-værdien af ​​dine data.

Metode 3 af 3: Relater SSE til anden statistik

  1. Beregn afvigelsen fra SSE. At finde SSE til et datasæt er generelt en byggesten til at finde andre, mere nyttige værdier. Den første af disse er varians. Variansen er et mål for, hvor meget de målte data afviger fra gennemsnittet. Det er faktisk middelværdien af ​​de kvadratiske forskelle fra middelværdien.
    • Da SSE er summen af ​​de kvadrerede fejl, kan du finde middelværdien (det er variansen) bare ved at dividere med antallet af værdier. Men hvis du beregner variansen af ​​en prøveserie snarere end en hel population, dividerer du variansen med (n-1) i stedet for med n. Så:
      • Varians = SSE / n, hvis du beregner variansen for en hel population.
      • Variance = SSE / (n-1), når variansen af ​​en stikprøve af data beregnes.
    • For prøveudtagningsproblemet med patienternes temperatur kan vi antage, at 10 patienter kun er en prøve. Derfor beregnes variansen som følger:
      • Variation=SSE(n1){ displaystyle { text {Variance}} = { frac { text {SSE}} {(n-1)}}Beregn standardafvigelsen for SSE. Standardafvigelse er en almindeligt anvendt værdi, der angiver, hvor langt værdierne i et datasæt afviger fra gennemsnittet. Standardafvigelsen er kvadratroden af ​​variansen. Husk, at variansen er gennemsnittet af de kvadratiske fejlmålinger.
        • Derfor kan du efter beregning af SSE finde standardafvigelsen som denne:
          • Standardafvigelse=SSEn1{ displaystyle { text {Standardafvigelse}} = { sqrt { frac { text {SSE}} {n-1}}}Brug SSE til at bestemme kovariansen. Denne artikel har fokuseret på datasæt, der kun måler en enkelt værdi ad gangen. I mange undersøgelser kan du dog sammenligne to separate værdier. For eksempel vil du vide, hvordan disse to værdier relaterer til hinanden, ikke kun til gennemsnittet af datasættet. Denne værdi er kovariansen.
            • Beregningerne for kovarians er for detaljerede til at blive beskrevet her, bortset fra at bemærke, at du vil bruge SSE til hver datatype og derefter sammenligne den. For en mere detaljeret beskrivelse af kovariansen og de involverede beregninger kan du finde artikler om dette emne på wikiHow.
            • Som et eksempel på brugen af ​​kovarians kan du sammenligne patienternes alder i en medicinsk undersøgelse med effektiviteten af ​​et lægemiddel til at sænke febertemperaturen. Derefter har du et datasæt i aldre og et andet datasæt med temperaturer. Du finder derefter SSE for hvert datasæt, og derfra varians, standardafvigelser og kovarians.