Sådan beregnes den lineære korrelationskoefficient

Forfatter: Eric Farmer
Oprettelsesdato: 7 Marts 2021
Opdateringsdato: 1 Juli 2024
Anonim
Sådan beregnes den lineære korrelationskoefficient - Samfund
Sådan beregnes den lineære korrelationskoefficient - Samfund

Indhold

Korrelationskoefficienten (eller lineær korrelationskoefficient) betegnes som "r" (i sjældne tilfælde som "ρ") og karakteriserer den lineære korrelation (det vil sige det forhold, der er givet ved en vis værdi og retning) af to eller flere variabler. Værdien af ​​koefficienten ligger mellem -1 og +1, det vil sige, at korrelationen kan være både positiv og negativ. Hvis korrelationskoefficienten er -1, er der en perfekt negativ korrelation; hvis korrelationskoefficienten er +1, er der en perfekt positiv korrelation. Ellers er der en positiv korrelation mellem de to variabler, en negativ korrelation eller ingen korrelation. Korrelationskoefficienten kan beregnes manuelt, med gratis online regnemaskiner eller med en god grafisk lommeregner.

Trin

Metode 1 af 4: Beregning af korrelationskoefficienten manuelt

  1. 1 Indsamle data. Inden du begynder at beregne korrelationskoefficienten, skal du studere disse par af tal. Bedre at skrive dem ned i en tabel, der kan arrangeres lodret eller vandret. Mærk hver række eller kolonne med "x" og "y".
    • For eksempel givet fire par værdier (tal) for variablerne "x" og "y". Du kan oprette følgende tabel:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 2 Beregn det aritmetiske middelværdi "x". For at gøre dette skal du tilføje alle x -værdierne og derefter dividere resultatet med antallet af værdier.
    • I vores eksempel er der fire værdier for variablen "x". For at beregne det aritmetiske gennemsnit "x", tilføj disse værdier, og divider derefter summen med 4. Beregningerne skrives som følger:
    • μx=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}
    • μx=12/4{ displaystyle mu _ {x} = 12/4}
    • μx=3{ displaystyle mu _ {x} = 3}
  3. 3 Find det aritmetiske middelværdi "y". For at gøre dette skal du følge de samme trin, det vil sige at tilføje alle y -værdierne og derefter dividere summen med antallet af værdier.
    • I vores eksempel er fire værdier for variablen "y" givet. Tilføj disse værdier, og divider derefter summen med 4. Beregningerne skrives som følger:
    • μy=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}
    • μy=16/4{ displaystyle mu _ {y} = 16/4}
    • μy=4{ displaystyle mu _ {y} = 4}
  4. 4 Beregn standardafvigelsen "x". Efter beregning af middelværdien af ​​"x" og "y" finder du standardafvigelserne for disse variabler. Standardafvigelsen beregnes ved hjælp af følgende formel:
    • σx=1n1Σ(xμx)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}
    • I vores eksempel vil beregningerne blive skrevet således:
    • σx=141((13)2+(23)2+(43)2+(53)2){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {4-1}} * ((1-3) ^ {2} + (2-3) ^ {2} + ( 4-3) ^ {2} + (5-3) ^ {2})}}}
    • σx=13(4+1+1+4){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (4 + 1 + 1 + 4)}}}}
    • σx=13(10){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (10)}}}
    • σx=103{ displaystyle sigma _ {x} = { sqrt { frac {10} {3}}}}
    • σx=1,83{ displaystyle sigma _ {x} = 1.83}
  5. 5 Beregn standardafvigelsen "y". Følg trinene beskrevet i det foregående trin. Brug den samme formel, men tilslut y -værdierne.
    • I vores eksempel vil beregningerne blive skrevet således:
    • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}
    • σy=13(9+1+1+9){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (9 + 1 + 1 + 9)}}}}
    • σy=13(20){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (20)}}}
    • σy=203{ displaystyle sigma _ {y} = { sqrt { frac {20} {3}}}}
    • σy=2,58{ displaystyle sigma _ {y} = 2,58}
  6. 6 Skriv grundformlen til beregning af korrelationskoefficienten ned. Denne formel indeholder midler, standardafvigelser og antallet (n) af parpar af begge variabler. Korrelationskoefficienten betegnes som "r" (i sjældne tilfælde som "ρ"). Denne artikel bruger en formel til at beregne Pearson -korrelationskoefficienten.
    • ρ=(1n1)Σ(xμxσx)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } højre) * venstre ({ frac {y- mu _ {y}} { sigma _ {y}}} højre)}
    • Her og i andre kilder kan mængder betegnes på forskellige måder. Nogle formler indeholder f.eks. “Ρ” og “σ”, mens andre indeholder “r” og “s”. Nogle lærebøger giver forskellige formler, men de er matematiske modstykker til ovenstående formel.
  7. 7 Beregn korrelationskoefficienten. Du har beregnet middelværdier og standardafvigelser for begge variabler, så du kan bruge formlen til at beregne korrelationskoefficienten. Husk, at "n" er antallet af værdipar for begge variabler. Andre værdier er blevet beregnet tidligere.
    • I vores eksempel vil beregningerne blive skrevet således:
    • ρ=(1n1)Σ(xμxσx)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } højre) * venstre ({ frac {y- mu _ {y}} { sigma _ {y}}} højre)}
    • ρ=(13){ displaystyle rho = venstre ({ frac {1} {3}} højre) *}[(131,83)(142,58)+(231,83)(342,58){ displaystyle left ({ frac {1-3} {1.83}} right) * left ({ frac {1-4} {2.58}} right) + left ({ frac {2 -3} {1.83}} højre) * venstre ({ frac {3-4} {2.58}} højre)}
         +(431,83)(542,58)+(531,83)(742,58){ displaystyle + venstre ({ frac {4-3} {1.83}} højre) * venstre ({ frac {5-4} {2.58}} højre) + venstre ({ frac { 5-3} {1.83}} højre) * venstre ({ frac {7-4} {2.58}} højre)}]
    • ρ=(13)(6+1+1+64,721){ displaystyle rho = venstre ({ frac {1} {3}} højre) * venstre ({ frac {6 + 1 + 1 + 6} {4.721}} højre)}
    • ρ=(13)2,965{ displaystyle rho = venstre ({ frac {1} {3}} højre) * 2.965}
    • ρ=(2,9653){ displaystyle rho = venstre ({ frac {2,965} {3}} højre)}
    • ρ=0,988{ displaystyle rho = 0.988}
  8. 8 Analyser resultatet. I vores eksempel er korrelationskoefficienten 0,988. Denne værdi karakteriserer på en eller anden måde et givet sæt talpar. Vær opmærksom på tegnets størrelse og størrelse.
    • Da værdien af ​​korrelationskoefficienten er positiv, er der en positiv sammenhæng mellem variablerne "x" og "y". Det vil sige, at når værdien af ​​"x" stiger, stiger værdien af ​​"y" også.
    • Da værdien af ​​korrelationskoefficienten er meget tæt på +1, er værdierne for variablerne "x" og "y" stærkt korreleret. Hvis du sætter punkter på koordinatplanet, vil de være placeret tæt på en lige linje.

Metode 2 af 4: Brug af online lommeregnere til at beregne korrelationskoefficienten

  1. 1 Find en lommeregner på Internettet for at beregne korrelationskoefficienten. Denne koefficient beregnes ofte i statistik. Hvis der er mange par af tal, er det næsten umuligt at beregne korrelationskoefficienten manuelt. Derfor er der online regnemaskiner til at beregne korrelationskoefficienten. I en søgemaskine skal du indtaste "korrelationskoefficientberegner" (uden anførselstegn).
  2. 2 Indtast data. Tjek vejledningen på webstedet for at indtaste de korrekte data (talpar). Det er bydende nødvendigt at indtaste de passende par numre; ellers får du det forkerte resultat. Husk, at forskellige websteder har forskellige inputformater.
    • For eksempel på http://ncalculators.com/statistics/correlation-coefficient-calculator.htm indtastes værdierne for variablerne x og y i to vandrette linjer. Værdierne adskilles med kommaer. Det vil sige, i vores eksempel indtastes værdierne "x" således: 1,2,4,5, og værdierne "y" sådan her: 1,3,5,7.
    • På et andet websted, http://www.alcula.com/calculators/statistics/correlation-coefficient/, indtastes data lodret; i dette tilfælde må du ikke forveksle de tilsvarende par med tal.
  3. 3 Beregn korrelationskoefficienten. Efter indtastning af dataene skal du blot klikke på knappen "Beregn", "Beregn" eller lignende for at få resultatet.

Metode 3 af 4: Brug af en grafisk lommeregner

  1. 1 Indtast data. Tag en grafisk lommeregner, gå ind i statistisk beregningsmåde og vælg kommandoen "Rediger".
    • Forskellige regnemaskiner kræver, at der trykkes på forskellige taster. Denne artikel diskuterer Texas Instruments TI-86-regnemaskinen.
    • Tryk på [2.] - Stat (over tasten +) for at gå ind i den statistiske beregningsmåde. Tryk derefter på F2 - Rediger.
  2. 2 Slet de tidligere gemte data. De fleste regnemaskiner gemmer den statistik, du indtaster, indtil du sletter dem. For at undgå at forveksle gamle data med nye skal du først slette alle lagrede oplysninger.
    • Brug piletasterne til at flytte markøren og fremhæve overskriften 'xStat'. Tryk derefter på Slet og Enter for at slette alle værdier, der er angivet i kolonnen xStat.
    • Brug piletasterne til at markere overskriften 'yStat'. Tryk derefter på Slet og Enter for at rydde alle værdier, der er angivet i kolonnen yStat.
  3. 3 Indtast de indledende data. Brug piletasterne til at flytte markøren til den første celle under overskriften "xStat". Indtast den første værdi, og tryk på Enter. I bunden af ​​skærmen vises "xStat (1) = __", hvor den indtastede værdi erstatter et mellemrum. Når du har trykket på Enter, vises den indtastede værdi i tabellen, og markøren flytter til den næste linje; dette viser "xStat (2) = __" nederst på skærmen.
    • Indtast alle værdierne for variablen "x".
    • Når du har indtastet alle værdierne for x, skal du bruge piletasterne til at navigere til yStat -kolonnen og indtaste værdierne for y.
    • Når du har indtastet alle par numre, skal du trykke på Afslut for at rydde skærmen og afslutte sammenlægningstilstanden.
  4. 4 Beregn korrelationskoefficienten. Det karakteriserer, hvor tæt dataene er på en bestemt lige linje. Grafregneren kan hurtigt bestemme den passende lige linje og beregne korrelationskoefficienten.
    • Klik på Stat - Calc. Tryk på [2nd] - [Stat] - [F1] på TI -86.
    • Vælg funktionen Lineær regression. Tryk på [F3] på TI-86, der er mærket "LinR". Skærmen viser linjen "LinR _" med en blinkende markør.
    • Indtast nu navnene på to variabler: xStat og yStat.
      • Åbn listen med navne på TI-86; For at gøre dette skal du trykke på [2nd] - [List] - [F3].
      • De tilgængelige variabler vises på bundlinjen på skærmen. Vælg [xStat] (du skal sandsynligvis trykke på F1 eller F2 for at gøre dette), indtast et komma, og vælg derefter [yStat].
      • Tryk på Enter for at behandle de indtastede data.
  5. 5 Analyser dine resultater. Ved at trykke på Enter viser skærmen følgende oplysninger:
    • y=-en+bx{ displaystyle y = a + bx}: dette er den funktion, der beskriver linjen. Bemærk, at funktionen ikke er skrevet i standardform (y = kx + b).
    • -en={ displaystyle a =}... Dette er y-koordinaten for skæringspunktet mellem den lige linje med y-aksen.
    • b={ displaystyle b =}... Dette er linjens hældning.
    • korr={ displaystyle { text {corr}} =}... Dette er korrelationskoefficienten.
    • n={ displaystyle n =}... Dette er antallet af par af tal, der blev brugt i beregningerne.

Metode 4 af 4: Forklaring af grundlæggende begreber

  1. 1 Forstå begrebet korrelation. Korrelation er det statistiske forhold mellem to størrelser. Korrelationskoefficienten er en numerisk værdi, der kan beregnes for to datasæt. Værdien af ​​korrelationskoefficienten ligger altid i området fra -1 til +1 og karakteriserer graden af ​​sammenhæng mellem to variabler.
    • For eksempel i betragtning af børns højde og alder (ca. 12 år). Mest sandsynligt vil der være en stærk positiv sammenhæng, fordi børn bliver højere med alderen.
    • Et eksempel på en negativ sammenhæng: straffesekunder og tid brugt på skiskytttræning, det vil sige, jo mere en atlet træner, desto færre straffesekunder vil blive tildelt.
    • Endelig er der nogle gange meget lidt sammenhæng (positiv eller negativ), f.eks. Mellem skostørrelse og matematiske scores.
  2. 2 Husk, hvordan du beregner det aritmetiske middel. For at beregne det aritmetiske middelværdi (eller middelværdi) skal du finde summen af ​​alle disse værdier og derefter dividere det med antallet af værdier. Husk, at det aritmetiske middel er nødvendigt for at beregne korrelationskoefficienten.
    • Middelværdien af ​​en variabel er angivet med et bogstav med en vandret bjælke over. For eksempel for variablerne "x" og "y" betegnes deres middelværdier som følger: x̅ og y̅. Middelværdien er undertiden betegnet med det græske bogstav "μ" (mu). For at skrive det aritmetiske gennemsnit af værdierne for variablen "x", skal du bruge notationen μx eller μ (x).
    • For eksempel givet følgende værdier for variablen "x": 1,2,5,6,9,10. Det aritmetiske middel af disse værdier beregnes som følger:
      • μx=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}
      • μx=33/6{ displaystyle mu _ {x} = 33/6}
      • μx=5,5{ displaystyle mu _ {x} = 5,5}
  3. 3 Bemærk betydningen af ​​standardafvigelsen. I statistik karakteriserer standardafvigelsen den grad, hvor tal er spredt i forhold til deres gennemsnit. Hvis standardafvigelsen er lille, er tallene tæt på middelværdien; hvis standardafvigelsen er stor, er tallene langt fra middelværdien.
    • Standardafvigelse angives med bogstavet "s" eller det græske bogstav "σ" (sigma). Standardafvigelsen af ​​værdierne for variablen "x" betegnes således som følger: sx eller σx.
  4. 4 Husk symbolet for summeringsoperationen. Summationssymbolet er et af de mest almindelige symboler i matematik og angiver summen af ​​værdier. Dette symbol er det græske bogstav "Σ" (store bogstaver).
    • For eksempel, hvis givet følgende værdier for variablen "x": 1,2,5,6,9,10, betyder Σx:
      • 1 + 2 + 5 + 6 + 9 + 10 = 33.

Tips

  • Korrelationskoefficienten kaldes undertiden "Pearson -korrelationskoefficienten" efter dens udvikler Carl Pearson.
  • I de fleste tilfælde, når korrelationskoefficienten er større end 0,8 (positiv eller negativ), er der en stærk korrelation; hvis korrelationskoefficienten er mindre end 0,5 (positiv eller negativ), observeres en svag korrelation.

Advarsler

  • Korrelation kendetegner forholdet mellem værdierne for to variabler. Men husk, at korrelation ikke har noget at gøre med årsagssammenhæng. For eksempel, hvis du sammenligner højde og sko størrelse på mennesker, vil du sandsynligvis finde en stærk positiv sammenhæng. Generelt, jo højere personen er, jo større er skostørrelsen. Men det betyder ikke, at en stigning i højden fører til en automatisk stigning i skostørrelse, eller at større fødder vil føre til hurtigere vækst. Disse mængder hænger simpelthen sammen.