Forfatter:
Charles Brown
Oprettelsesdato:
9 Februar 2021
Opdateringsdato:
1 Juli 2024
Indhold
Summen af firkanter eller SSE er en foreløbig statistisk beregning, der fører til forskellige dataværdier. Når du har et sæt dataværdier, er det nyttigt at kunne bestemme, hvor tæt disse værdier er. Du skal organisere dine data i en tabel og derefter udføre forholdsvis enkle beregninger. Når du har fundet SSE for et datasæt, kan du derefter finde variansen og standardafvigelsen.
At træde
Metode 1 af 3: Beregn SSE manuelt
- Opret en tre-kolonnetabel. Den klareste måde at beregne SSE på er at starte med en tre kolonnetabel. Mærk de tre kolonner Udfyld detaljerne. Den første kolonne indeholder værdierne for dine målinger. Udfyld kolonnen Beregn gennemsnittet. Inden du kan beregne fejlen for hver måling, skal du beregne gennemsnittet af hele datasættet.
- Gennemsnittet af et datasæt er summen af værdierne divideret med antallet af værdier i sættet. Dette kan repræsenteres symbolsk med variablen Beregn de individuelle fejlværdier. I den anden kolonne i din tabel skal du indtaste fejlværdierne for hver dataværdi. Fejlen er forskellen mellem målingen og gennemsnittet.
- For det givne datasæt skal du trække gennemsnittet, 98,87, fra hver målte værdi og udfylde den anden kolonne med resultaterne. Disse ti beregninger går som følger:
- Beregn SSE. I den tredje kolonne i tabellen skal du finde firkanten af hver af de resulterende værdier i den midterste kolonne. Disse repræsenterer kvadraterne for afvigelsen fra gennemsnittet for hver målte dataværdi.
- For hver værdi i den midterste kolonne skal du bruge en lommeregner til at beregne firkanten. Optag resultaterne i tredje kolonne som følger:
- Læg firkanterne for fejlene sammen. Det sidste trin er at finde summen af værdierne i den tredje kolonne. Det ønskede resultat er SSE eller summen af kvadraterne for fejlene.
- For dette datasæt beregnes SSE ved at tilføje de ti værdier i den tredje kolonne:
- Mærk kolonnerne i regnearket. Du opretter en tabel med tre kolonner i Excel med de samme tre overskrifter som ovenfor.
- Skriv "Værdi" som overskrift i celle A1.
- Skriv "Afvigelse" som overskrift i felt B1.
- I felt C1 skal du skrive "Afvigelse i kvadrat" som overskrift.
- Indtast dine oplysninger. I den første kolonne skal du indtaste værdierne for dine målinger. Hvis sættet er lille, kan du nemt skrive det i hånden. Hvis du har et stort datasæt, skal du muligvis kopiere og indsætte dataene i kolonnen.
- Bestem gennemsnittet af datapunkterne. Excel har en funktion, der beregner gennemsnittet for dig. I en tom celle under din datatabel (det betyder ikke noget, hvilken celle du vælger), skal du indtaste følgende:
- = Gennemsnit (A2: ___)
- Indtast ikke blank plads. Udfyld dette mellemrum med cellenavnet på dit sidste datapunkt. For eksempel, hvis du har 100 datapunkter, vil du bruge funktionen:
- = Gennemsnit (A2: A101)
- Denne funktion indeholder dataene fra cellerne A2 til og med A101, fordi den øverste række indeholder kolonneoverskrifterne.
- Når du trykker på Enter, eller når du klikker på en anden celle i tabellen, udfyldes den nyprogrammerede celle automatisk med gennemsnittet af dine dataværdier.
- Indtast funktionen til fejlmålingerne. I den første tomme celle i kolonnen "Afvigelse" skal du indtaste en funktion for at beregne forskellen mellem hvert datapunkt og middelværdien. For at gøre dette skal du bruge cellenavnet, hvor gennemsnittet er placeret. Lad os antage, at du har brugt celle A104 indtil videre.
- Fejlberegningsfunktionen, som du indtaster i celle B2, er:
- = A2- $ A $ 104. Dollartegnene er nødvendige for at sikre, at du låser boks A104 til enhver beregning.
- Fejlberegningsfunktionen, som du indtaster i celle B2, er:
- Indtast funktionen for de kvadrerede fejl. I den tredje kolonne kan du instruere Excel om at beregne den ønskede firkant.
- Indtast følgende funktion i celle C2:
- = B2 ^ 2
- Indtast følgende funktion i celle C2:
- Kopier funktionerne for at udfylde hele tabellen. Når du har indtastet funktionerne i den øverste celle i hver kolonne, henholdsvis B2 og C2, skal du udfylde hele tabellen. Du kan indtaste funktionen igen i en hvilken som helst linje i tabellen, men det vil tage alt for lang tid. Brug musen til at fremhæve cellerne B2 og C2 sammen, og uden at slippe museknappen skal du trække til den nederste celle i hver kolonne.
- Forudsat at du har 100 datapunkter i din tabel, skal du trække musen til cellerne B101 og C101.
- Når du slipper museknappen, kopieres formlerne til alle celler i tabellen. Tabellen skal automatisk udfyldes med de beregnede værdier.
- Find SSE. Kolonne C i din tabel indeholder alle kvadratiske fejlværdier. Det sidste trin er at lade Excel beregne summen af disse værdier.
- Indtast følgende funktion i en celle under tabellen, sandsynligvis C102 i dette eksempel:
- = Sum (C2: C101)
- Hvis du klikker på Enter eller klikker væk i en anden celle i tabellen, får du SSE-værdien af dine data.
- Indtast følgende funktion i en celle under tabellen, sandsynligvis C102 i dette eksempel:
- Læg firkanterne for fejlene sammen. Det sidste trin er at finde summen af værdierne i den tredje kolonne. Det ønskede resultat er SSE eller summen af kvadraterne for fejlene.
- For hver værdi i den midterste kolonne skal du bruge en lommeregner til at beregne firkanten. Optag resultaterne i tredje kolonne som følger:
- Beregn SSE. I den tredje kolonne i tabellen skal du finde firkanten af hver af de resulterende værdier i den midterste kolonne. Disse repræsenterer kvadraterne for afvigelsen fra gennemsnittet for hver målte dataværdi.
- For det givne datasæt skal du trække gennemsnittet, 98,87, fra hver målte værdi og udfylde den anden kolonne med resultaterne. Disse ti beregninger går som følger:
- Gennemsnittet af et datasæt er summen af værdierne divideret med antallet af værdier i sættet. Dette kan repræsenteres symbolsk med variablen Beregn de individuelle fejlværdier. I den anden kolonne i din tabel skal du indtaste fejlværdierne for hver dataværdi. Fejlen er forskellen mellem målingen og gennemsnittet.
Metode 3 af 3: Relater SSE til anden statistik
- Beregn afvigelsen fra SSE. At finde SSE til et datasæt er generelt en byggesten til at finde andre, mere nyttige værdier. Den første af disse er varians. Variansen er et mål for, hvor meget de målte data afviger fra gennemsnittet. Det er faktisk middelværdien af de kvadratiske forskelle fra middelværdien.
- Da SSE er summen af de kvadrerede fejl, kan du finde middelværdien (det er variansen) bare ved at dividere med antallet af værdier. Men hvis du beregner variansen af en prøveserie snarere end en hel population, dividerer du variansen med (n-1) i stedet for med n. Så:
- Varians = SSE / n, hvis du beregner variansen for en hel population.
- Variance = SSE / (n-1), når variansen af en stikprøve af data beregnes.
- For prøveudtagningsproblemet med patienternes temperatur kan vi antage, at 10 patienter kun er en prøve. Derfor beregnes variansen som følger:
- Beregn standardafvigelsen for SSE. Standardafvigelse er en almindeligt anvendt værdi, der angiver, hvor langt værdierne i et datasæt afviger fra gennemsnittet. Standardafvigelsen er kvadratroden af variansen. Husk, at variansen er gennemsnittet af de kvadratiske fejlmålinger.
- Derfor kan du efter beregning af SSE finde standardafvigelsen som denne:
- Brug SSE til at bestemme kovariansen. Denne artikel har fokuseret på datasæt, der kun måler en enkelt værdi ad gangen. I mange undersøgelser kan du dog sammenligne to separate værdier. For eksempel vil du vide, hvordan disse to værdier relaterer til hinanden, ikke kun til gennemsnittet af datasættet. Denne værdi er kovariansen.
- Beregningerne for kovarians er for detaljerede til at blive beskrevet her, bortset fra at bemærke, at du vil bruge SSE til hver datatype og derefter sammenligne den. For en mere detaljeret beskrivelse af kovariansen og de involverede beregninger kan du finde artikler om dette emne på wikiHow.
- Som et eksempel på brugen af kovarians kan du sammenligne patienternes alder i en medicinsk undersøgelse med effektiviteten af et lægemiddel til at sænke febertemperaturen. Derefter har du et datasæt i aldre og et andet datasæt med temperaturer. Du finder derefter SSE for hvert datasæt, og derfra varians, standardafvigelser og kovarians.
- Brug SSE til at bestemme kovariansen. Denne artikel har fokuseret på datasæt, der kun måler en enkelt værdi ad gangen. I mange undersøgelser kan du dog sammenligne to separate værdier. For eksempel vil du vide, hvordan disse to værdier relaterer til hinanden, ikke kun til gennemsnittet af datasættet. Denne værdi er kovariansen.
- Derfor kan du efter beregning af SSE finde standardafvigelsen som denne:
- Beregn standardafvigelsen for SSE. Standardafvigelse er en almindeligt anvendt værdi, der angiver, hvor langt værdierne i et datasæt afviger fra gennemsnittet. Standardafvigelsen er kvadratroden af variansen. Husk, at variansen er gennemsnittet af de kvadratiske fejlmålinger.
- Da SSE er summen af de kvadrerede fejl, kan du finde middelværdien (det er variansen) bare ved at dividere med antallet af værdier. Men hvis du beregner variansen af en prøveserie snarere end en hel population, dividerer du variansen med (n-1) i stedet for med n. Så: