Sådan vurderes statistisk signifikans: 15 trin (med foto) - Tips

Video.: ФРС - итоги, Байден VS Рейган, Эпоха «мыльных» активов, курс доллара, нефть, золото,SP500,Акции ММВБ

Indhold

Trin
Råd
Advarsel

Hypotesetest styres af statistisk analyse. Statistisk signifikant tillid beregnes ved hjælp af p-værdi - hvilket indikerer sandsynligheden for et observeret resultat, når en bestemt (nul hypotese) er sand. Hvis p-værdien er mindre end signifikansniveauet (normalt 0,05), kan eksperimentatoren konkludere, at der er tilstrækkelig dokumentation til at afvise nulhypotesen og indrømme den inverse hypotese. Ved hjælp af en simpel t-test kan du beregne p-værdien og bestemme betydningen mellem to forskellige datagrupper.

Trin

Del 1 af 3: Opret dine eksperimenter

Bestem din hypotese. Det første trin i vurderingen af statistisk signifikans er at identificere de spørgsmål, der skal besvares, og erklære din hypotese. Hypotese er en erklæring om de empiriske data og mulige uoverensstemmelser i befolkningen. Hvert eksperiment har en nulhypotese og en invers hypotese. Generelt sammenligner du to grupper for at se, om de er ens eller forskellige.
- Generelt er hypotesen ikke (H₀) bekræft, at der ikke er nogen forskel mellem de to datagrupper. Eksempel: Studerende, der læser materialet før klassen, får ikke bedre slutkarakterer.
- Den omvendte hypotese (H_-en) er i modstrid med nulhypotesen og er en erklæring, som du forsøger at støtte med dine empiriske data. Eksempel: Studerende, der læser materialet før klassen, får faktisk bedre slutkarakterer.
Vælg signifikansniveau for at bestemme graden af forskel, der kan ses som meningsfuld i dataene. Betydningsniveauet (også kendt som alfa) er den tærskel, du vælger for at bestemme betydningen. Hvis p-værdien er mindre end eller lig med et givet signifikansniveau, betragtes dataene som statistisk signifikante.
- Som hovedregel vælges signifikansniveauet (eller alfa) normalt på 0,05-niveauet - hvilket betyder, at chancen for at observere forskellen set på dataene kun er tilfældig 5%.
- Jo højere konfidensniveau (og derfor jo lavere p-værdi), jo mere meningsfulde bliver resultaterne.
- Hvis der kræves mere tillid, skal du sænke p-værdien til 0,01. En lav p-værdi bruges ofte til fremstilling af produktfejl. En høj grad af pålidelighed er afgørende for at acceptere, at hver del fungerer som den skal.
- For de fleste hypotesebaserede eksperimenter er et signifikansniveau på 0,05 acceptabelt.
Beslut om du skal bruge en ensidig eller to-halet test. En af forudsætningerne for t-test er, at dine data er i en normalfordeling. Normalfordelingen danner en klokkekurve, hvor størstedelen af observationer er centreret. T-testen er en matematisk test, der kontrollerer, om dine data falder uden for normalfordelingen, over eller under, i den "øverste" del af kurven.
- Hvis du ikke er sikker på, om dataene er over eller under kontrolgruppen, skal du bruge en test med to haler. Det giver dig mulighed for at kontrollere betydning i begge retninger.
- Hvis du ved hvad den forventede retning for dine data er, skal du bruge en ensidig test. I eksemplet ovenfor forventer du, at den studerendes score forbedres. Derfor bruger du den ensidige test.
Bestem prøvestørrelse med kraftanalyse. Kraften ved en test er evnen til at observere det forventede resultat med en given prøvestørrelse. Den fælles tærskel for kraft (eller β) er 80%. Kraftanalyse kan være ret kompliceret uden nogle foreløbige data, fordi du har brug for nogle oplysninger om det forventede gennemsnit mellem grupperne og deres standardafvigelser. Brug online kraftanalyse til at bestemme den optimale stikprøvestørrelse for dine data.
- Forskere udfører ofte en lille forudsætningsundersøgelse for at informere om kraftanalysen og beslutte, hvilken stikprøvestørrelse der er nødvendig for en stor og omfattende undersøgelse.
- Hvis der ikke er nogen midler til at udføre kompleks forskningsundersøgelse, skal du estimere det mulige gennemsnit baseret på læsning af artikler og forskning, som andre personer muligvis har gjort. Det kan give dig en god start med at bestemme prøvestørrelser.
reklame

Del 2 af 3: Beregn standardafvigelsen

Bestem formlen for standardafvigelse. Standardafvigelse måler spredningen af dataene. Det giver dig information om identiteten af hvert datapunkt i prøven. Når man først kommer i gang, kan ligninger se ret komplicerede ud. Men nedenstående trin hjælper dig med let at forstå beregningsprocessen. Formlen er s = √∑ ((x_jeg - µ) / (N - 1)).
- s er standardafvigelsen.
- ∑ angiver, at du bliver nødt til at tilføje alle de observerede observationer.
- x_jeg hver repræsenterer din dataværdi.
- µ er gennemsnittet af dataene for hver gruppe.
- N er det samlede antal observationer.
Gennemsnit antal observationer i hver gruppe. For at beregne standardafvigelsen skal du først beregne gennemsnittet af observationer for hver enkelt gruppe. Denne værdi er angivet med det græske bogstav mu eller µ. For at gøre det skal du blot tilføje observationer og dele med det samlede antal observationer.
- For eksempel, for at finde den gennemsnitlige score for den gruppe, der læser dokumentet før klassen, skal vi se på nogle data. For enkelheds skyld bruger vi et datasæt på 5 point: 90, 91, 85, 83 og 94 (på en 100-punkts skala).
- Tilføj alle observationer: 90 + 91 + 85 + 83 + 94 = 443.
- Opdel summen ovenfor med antallet af observationer N (N = 5): 443/5 = 88,6.
- Den gennemsnitlige score for denne gruppe er 88,6.
Træk gennemsnittet fra hver observerede værdi. Det næste trin involverer del (x_jeg - µ) af ligningen. Træk gennemsnitsværdien fra hver observerede værdi. Med ovenstående eksempel har vi fem subtraktioner.
- (90 - 88,6), (91-88,6), (85 - 88,6), (83 - 88,6) og (94 - 88,6).
- Den beregnede værdi er 1,4; 2,4; -3,6; -5,6 og 5,4.
Firkant ovenstående forskelle og læg dem sammen. Hver netop beregnede nye værdi kvadreres nu. Her fjernes det negative tegn også. Hvis der vises et negativt tegn efter dette trin eller i slutningen af beregningen, har du muligvis glemt at udføre ovenstående trin.
- I vores eksempel vil vi nu arbejde med 1,96; 5,76; 12,96; 31.36 og 29.16.
- Tilføj disse firkanter sammen: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
Divider med det samlede antal observationer minus 1. At dividere med N - 1 hjælper med at kompensere for en beregning, der ikke udføres på befolkningen som helhed, men som er baseret på en stikprøve af alle studerende.
- Træk fra: N - 1 = 5 - 1 = 4
- Opdel: 81,2 / 4 = 20,3
Få kvadratroden. Når divideret med antallet af observationer minus 1, skal kvadratroden af den opnåede værdi tages. Dette er det sidste trin i beregningen af standardafvigelsen. Nogle statistiske programmer hjælper dig med at udføre denne beregning, efter at de originale data er importeret.
- Med ovenstående eksempel er standardafvigelsen for slutningen af semesterkarakteren for studerende, der læser dokumentet før klassen: s = √20,3 = 4,51.
reklame

Del 3 af 3: Bestemmelse af statistisk signifikans

Beregn variansen mellem dine to observationsgrupper. Indtil dette punkt har eksemplet kun behandlet en gruppe observationer. For at sammenligne to grupper har du naturligvis brug for data fra begge. Beregn standardafvigelsen for den anden gruppe observationer og brug den til at beregne variansen mellem de to eksperimentelle grupper. Formlen til beregning af varians er: s_d = √ ((s₁/ N₁) + (s₂/ N₂)).
- S_d er variansen mellem grupperne.
- S₁ er standardafvigelsen for gruppe 1 og N₁ er størrelsen på gruppe 1.
- S₂ er standardafvigelsen for gruppe 2 og N₂ er størrelsen på gruppe 2.
- Lad os i vores eksempel sige, at dataene fra gruppe 2 (studerende, der ikke læste teksten før klassen) har en størrelse på 5 og en standardafvigelse på 5,81. Variansen er:
  - S_d = √ ((s₁) / N₁) + ((s₂) / N₂))
  - S_d = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
Beregn t-score for dataene. En t-statistik giver dig mulighed for at konvertere data til en formular, der kan sammenlignes med andre data. T-værdien giver dig også mulighed for at udføre en t-test, en test, der giver dig mulighed for at beregne sandsynligheden for en statistisk signifikant forskel mellem de to grupper. Formlen til beregning af t-statistikken er: t = (µ₁ – µ₂) / S_d.
- µ₁ er gennemsnittet for den første gruppe.
- µ₂ er gennemsnittet for den anden gruppe.
- S_d er variansen mellem observationerne.
- Brug det større middel som µ₁ for ikke at få en negativ t-statistik.
- Antag for vores eksempel, at det observerede gennemsnit for gruppe 2 (som ikke læste den foregående artikel) er 80. T-score er: t = (µ₁ – µ₂) / S_d = (88,6 – 80)/3,29 = 2,61.
Bestem graden af prøvefrihed. Når du bruger t-statistikken, bestemmes frihedsgraderne baseret på stikprøvestørrelsen. Læg antallet af observationer for hver gruppe sammen, og træk derefter to fra. I ovenstående eksempel er frihedsgraden (d.f.) 8, fordi der er 5 observationer i den første gruppe og 5 prøver i den anden gruppe ((5 + 5) - 2 = 8).
Brug tabel t til at evaluere betydning. Tabeller over t-værdier og frihedsgrader kan findes i en standardstatistikbog eller online. Find rækken, der indeholder datafrihedsgraderne, og den p-værdi, der svarer til den t-statistik, du har.
- Med frihedsgrader 8 og t = 2,61 ligger p-værdien for en ensidig test mellem 0,01 og 0,025. Da det valgte signifikansniveau er mindre end eller lig med 0,05, er vores data statistisk signifikante. Med disse data afviser vi nulhypotesen og accepterer den omvendte hypotese: studerende, der læser materialet før klassen, har højere slutresultater.
Overvej at udføre yderligere forskning. Mange forskere udfører forudsætningsstudier med flere målinger for at forstå, hvordan man designer en større undersøgelse. At udføre anden forskning med flere målinger øger din tillid til dine konklusioner. reklame

Råd

Statistik er et stort og komplekst felt. Tag et gymnasium eller universitet (eller højere) statistisk hypotesetestkursus for at forstå statistisk signifikans.

Advarsel

Denne analyse fokuserer på t-testen for at kontrollere forskellen mellem de to normalfordelingspopulationer. Afhængigt af kompleksiteten af dataene kan du få brug for en anden statistisk test.