P Waarde Berekenen

P Waarde Berekenen
Hoe bereken je een p-waarde (p-value)? Bij een is de dat er geen verschil is tussen de groepsgemiddelden. Als een groep significant verschilt van het algemene groepsgemiddelde, dan zal de ANOVA een resultaat rapporteren. Significante verschillen tussen worden berekend met behulp van een F -statistiek, die de verhouding weergeeft tussen de gemiddelde som van de kwadraten (de die door de onafhankelijke variabele wordt verklaard) en de gemiddelde kwadratische fout (de variantie die overblijft).

Het toetsen van de gecombineerde effecten van vaccinatie (gevaccineerd of niet gevaccineerd) en gezondheidsstatus (gezond of al bestaande aandoening) op de mate van griepinfectie in een,

Het toetsen van de effecten van burgerlijke staat (gehuwd, ongehuwd, gescheiden, weduwnaar), beroepsstatus (zelfstandig, werkend, werkloos, gepensioneerd) en familiegeschiedenis (geen familiegeschiedenis, enige familiegeschiedenis) op de incidentie van depressie in een populatie.

Het toetsen van effecten van het soort voeding (soort A, B of C) en stalbezetting (niet vol, enigszins vol, zeer vol) op het eindgewicht van kippen in een commercieel landbouwbedrijf.

Het enige verschil tussen een one-way ANOVA en een two-way ANOVA is het aantal, Een one-way ANOVA heeft één onafhankelijke variabele, terwijl een two-way ANOVA er twee heeft.

: Toetst de relatie tussen het merk schoen (Nike, Adidas, Saucony, Hoka) en de finishtijd van een marathon.

Two-way ANOVA: Toetst de relatie tussen het merk schoen (Nike, Adidas, Saucony, Hoka), leeftijdsgroep van de loper (junior, senior, master) en de finishtijd van een marathon.

Alle zijn bedoeld om te toetsen op verschillen tussen drie of meer groepen. Als je alleen op een verschil tussen twee groepen wilt testen, gebruik dan een, In de formule van de is lambda (λ) het gemiddelde aantal gebeurtenissen binnen een bepaald tijds- of ruimte-interval.

  • Bijvoorbeeld: λ = 0.748 overstromingen per jaar.
  • De e in de formule van de staat voor het getal 2.718.
  • Dit getal wordt de constante van Euler genoemd.
  • Je kunt e simpelweg vervangen door 2.718 als je een kans van de Poissonverdeling berekent.
  • De constante van Euler is een heel nuttig getal en is vooral belangrijk in de wiskunde.

Je kunt het beste alleen verwijderen als je daar een goede reden voor hebt. Sommige uitschieters vertegenwoordigen natuurlijke variatie in de en deze mogen niet worden verwijderd uit je dataset. Dit zijn echte uitschieters. Andere uitschieters zijn problematisch en moeten worden verwijderd uit je dataset.

  1. Het sorteren van je waarden van laag naar hoog en het controleren van minimum- en maximumwaarden.
  2. Het visualiseren van je data met een en zoeken naar uitschieters.
  3. De gebruiken om de grenzen voor je data te vinden.
  4. Statistische toetsen uitvoeren om extreme waarden te identificeren.

De werd voor het eerst beschreven door statisticus William Sealy Gosset onder het pseudoniem “Student”. Om een van een te berekenen met behulp van de kritieke waarde van t, volg je deze vier stappen:

  1. Kies het op basis van het gewenste betrouwbaarheidsniveau. Het meest gebruikelijke betrouwbaarheidsniveau is 95%, wat overeenkomt met α =,05 in de tweezijdige,
  2. Zoek de kritieke waarde van t in de tweezijdige t -tabel.
  3. Vermenigvuldig de kritieke waarde van t met,
  4. Tel deze waarde bij het gemiddelde op om de bovengrens van het betrouwbaarheidsinterval te berekenen, en trek deze waarde van het gemiddelde af om de ondergrens van het betrouwbaarheidsinterval te berekenen.

Je kunt de T.INV() functie gebruiken om de kritieke waarde van t te vinden voor eenzijdige toetsen in Excel. Voor tweezijdige toetsen gebruik je de T.INV.2T() functie. Voorbeeld: De kritieke waarde van t berekenen in Excel Om de kritieke waarde van t te berekenen voor een tweezijdige toets met df = 29 en α =,05, klik je op een lege cel en typ je: =T.INV.2T(0.05,29) Je kunt de qt() functie gebruiken om de kritieke waarde van t te vinden in R.

De functie geeft de kritieke waarde van t voor de eenzijdige toets. Als je de kritieke waarde van t voor een tweezijdige toets wilt, deel je het door twee. Voorbeeld: De kritieke waarde van t berekenen in R Om de kritieke waarde van t voor een tweezijdige toets met df = 29 en α =,05 te berekenen, gebruik je de volgende functie: qt(p =,025, df = 29) Je kunt de PEARSON() functie gebruiken om de ( r ) in Excel te berekenen.

Als je in de kolommen A en B staan, klik je op een lege cel en typ je “PEARSON(A:A, B:B)”. Er is geen functie om de van de correlatie direct te berekenen. Om een met behulp van de kritieke waarde van t, volg je deze vier stappen:

  1. Bereken de en van je,
  2. Zoek de kritieke waarde van deze t -waarde in de die hoort bij de juiste vrijheidsgraden.
  3. Bepaalde of de (absolute) t -waarde groter is dan de kritieke waarde van t,
  4. Verwerp de nulhypothese als de t -waarde van de steekproef groter is dan de kritieke waarde van t, Zo niet, dan verwerp je de nulhypothese niet.

Als er slechts één of twee zijn, heeft de de vorm van een omgekeerde “J”. Als er drie of meer vrijheidsgraden zijn, heeft de verdeling de vorm van een bult ( hump ). Naarmate het aantal vrijheidsgraden verder toeneemt, wordt de bult minder rechtsscheef en verschuift de piek van de bult naar rechts.

: Een negatieve excess kurtosis. Platykurtische verdelingen hebben een dunne staart, wat betekent dat ze weinig hebben.

: Een positieve excess kurtosis. Leptokurtische verdelingen hebben een dikke staart, wat betekent dat ze veel uitschieters hebben.

Een is jouw verwachte antwoord op de onderzoeksvraag. De onderzoekshypothese bevat meestal een verklaring ( x beïnvloedt y omdat). Een statistische hypothese is een wiskundige uitspraak over een populatieparameter. Statistische hypothesen komen altijd in paren: de,

In een goede komen de nul- en alternatieve hypothese logisch overeen met de onderzoekshypothese. Soms hoef je alleen de alternatieve hypothese te formuleren. De wordt vaak afgekort tot H a of H 1, Als de alternatieve hypothese wordt beschreven met wiskundige symbolen, bevat deze altijd een ongelijkheidssymbool (meestal ≠, maar soms ook ).

De wordt vaak afgekort tot H 0, Als de nulhypothese wordt beschreven met wiskundige symbolen, bevat deze altijd een gelijkheidssymbool (meestal =, maar soms ook ≥ of ≤). Er kan een onderscheid worden gemaakt tussen kwantitatieve en categorische :

  • Bij kwantitatieve variabelen representeren de data hoeveelheden (zoals een lengte, gewicht, leeftijd).
  • Bij categorische variabelen representeren de data groepen, zoals een ranking (bijvoorbeeld de eindposities bij het songfestival), classificaties (bijvoorbeeld kledingmerken), en binaire verdelingen (zoals kop of munt).

Zowel de en een kunnen worden gebruikt om het verschil tussen twee groepen te onderzoeken. Echter, een t-toets wordt gebruikt als je een kwantitatieve afhankelijke variabele hebt en een categorische onafhankelijke variabele (met twee groepen). Een chi-kwadraattoets voor samenhang wordt gebruikt bij twee categorische, De drie soorten (scheefheid) zijn:

Rechtsscheef (right skew). Een rechtsscheve verdeling (ook wel positief-scheve verdeling genoemd) is langer aan de rechterkant van de piek dan aan de linkerkant.

Linksscheef (left skew). Een linksscheve verdeling (ook wel negatief-scheve verdeling genoemd) is langer aan de linkerkant van de piek dan aan de rechterkant.

Zero skew. Een verdeling met zero skew (nul scheefheid) is symmetrisch, wat inhoudt dat de linker- en rechterkant spiegelbeelden van elkaar zijn.

en kurtosis zijn beide belangrijke maten voor de vorm van een verdeling.

  • Skewness (scheefheid) meet de asymmetrie van een verdeling.
  • Kurtosis (welving) meet de dikte van de staart van een verdeling ten opzichte van de,

Om het te berekenen, moet je het volgende weten:

  • De puntschatting waarvoor je het betrouwbaarheidsinterval opzet
  • De kritieke waarden voor de teststatistiek
  • De van je
  • De steekproefgrootte

Als je al deze dingen weet, kun je het betrouwbaarheidsinterval voor je schatting berekenen door ze in de formule voor het betrouwbaarheidsinterval te zetten die overeenkomt met je data. Wat de formule precies is hangt af van het type schatting (e.g., een gemiddelde of een proportie) en van de verdeling van je data.

Als je voor het verschil tussen groepen een nul bevat, betekent dit dat er een grote kans bestaat dat je geen verschil vindt tussen de groepen als je het experiment nog een keer uitvoert. Als je betrouwbaarheidsinterval voor een of nul bevat, betekent dit dat er een grote kans bestaat dat je geen correlatie vindt in je data als je het experiment nog een keert uitvoert.

In beide gevallen zul je ook een hoge vinden bij je statistische test. Dit houdt in dat je resultaten zouden kunnen voorkomen onder de, Dit zou betekenen dat de resultaten geen relatie tussen de variabelen ondersteunen. Een kritieke waarde is een waarde van de teststatistiek die de boven- en ondergrens van het definieert, of de drempelwaarde van in een statistische test.

Het beschrijft hoe ver je van het gemiddelde van de verdeling af moet liggen om een bepaalde hoeveelheid van de totale variatie in de data te dekken (i.e., 90%, 95%, 99%). Als je zowel een 95%-betrouwbaarheidsinterval als een drempelwaarde van statistische significantie van p = 0.05 aanhoudt, dan zullen je kritieke waarden in beide gevallen identiek zijn.

Het bestaat uit de boven- en ondergrens van de schatting die je verwacht te vinden bij een gegeven betrouwbaarheidsniveau. Het betrouwbaarheidsniveau ( confidence level ) is het percentage van de keren dat je verwacht in de buurt van dezelfde schatting te komen als je je experiment nog een keer uitvoert of opnieuw op dezelfde manier een steekproef uit de populatie haalt.

Voorbeeld Je wilt weten wat het gemiddelde aandeel is van het aantal meisjes dat elk jaar geboren wordt. Hiertoe gebruik je een willekeurige steekproef van baby’s. Met een 95%-betrouwbaarheidsinterval vind je een bovengrens van 0.56 en een ondergrens van 0.48. Het betrouwbaarheidsniveau is 95%. De z -waarde en t- waarde (ook wel z -score en t -score) geven aan hoeveel je van het van de verdeling verwijderd bent, mits je data een z -verdeling of een volgen.

Als uit je test een z -score van 2.5 naar voren komt, betekent dit dat je schatting 2.5 standaarddeviaties van het gemiddelde afwijkt. Het voorspelde gemiddelde en de voorspelde verdeling van je schatting worden bepaald door de van de statistische test die je uitvoert.

Hoe meer standaarddeviaties van het gemiddelde je schatting afwijkt, hoe kleiner de kans dat je schatting daadwerkelijk onder je nulhypothese heeft kunnen plaatsvinden. De standaardnormale verdeling, ook wel z -verdeling genoemd, is een speciale waarbij het gelijk is aan 0 en de gelijk is aan 1. Elke normale verdeling kan worden omgezet in de standaardnormale verdeling door de individuele waarden om te zetten in z -waarden ( z -scores).

In een z -verdeling geven z -scores aan hoeveel standaarddeviaties elke waarde van het gemiddelde afligt. Je kunt de samenvattingsfunctie() (ook wel summary () function) gebruiken om R² () van een lineair model weer te geven in R. Onderaan de output zie je “R-kwadraat” (“R-squared”) staan.

De ( R ²) is een getal tussen de 0 en 1 dat de mate aanduidt waarin een statistisch model in staat is een bepaalde uitkomst te voorspellen. Je kunt de R ² interpreteren als de proportie (het deel) van de in de die wordt voorspeld door het statistisch model. Het is altijd duidelijk of een getal een is.

Om te bepalen met welke van de twee je te maken hebt, kun jezelf de volgende vragen stellen:

  • Beschrijft het getal een gehele, complete populatie waarbij elk lid kan worden bereikt voor de ?
  • Is het mogelijk om binnen een redelijke termijn data voor ieder lid van de populatie te verzamelen?

Als het antwoord op beide vragen ja is, is het getal waarschijnlijk een parameter. Als het antwoord op een van de vragen nee is, is de kans groter dat het om een statistiek gaat. Een is een waarde die een hele beschrijft (bijvoorbeeld het populatiegemiddelde), terwijl een statistiek een getal is dat een beschrijft (bijvoorbeeld het steekproefgemiddelde).

Er bestaat een omgekeerd evenredig verband tussen het risico op een en de statistische power van een onderzoek. De power is de mate waarin een toets een daadwerkelijk bestaand effect correct kan detecteren. Om het risico op een Type II-fout (indirect) te verkleinen, kun je de steekproef vergroten of het verhogen, omdat je zo de statistische power vergroot.

Het risico op een is gelijk aan het dat je kiest voor je onderzoek. Je vergelijkt de met dit niveau om te bepalen of je resultaten zijn. Het significantieniveau is meestal 0.05 of 5%. Dit betekent dat er een kans van 5% is dat de gevonden resultaten zouden voorkomen als de daadwerkelijk waar zou zijn.

  • Als je een Type I-fout maakt, verwerp je de ten onrechte.
  • Als je een Type II-fout maakt, verwerp je de nulhypothese ten onrechte niet.

De is een meer conservatieve vorm van de standaardnormale verdeling (ook wel z -verdeling of standard normal distribution genoemd). Dit betekent dat de t -verdeling een lagere kansdichtheid geeft voor het centrum en een hogere kansdichtheid voor de staarten dan de standaard normaleverdeling.

  1. De boven- en ondergrenzen van een als de data ongeveer normaal verdeeld zijn.
  2. De van de teststatistiek voor t -toetsen en regressieanalyses.

De (ook wel t -distribution of Student’s t -distribution genoemd) wordt gebruikt als de data bij benadering normaal verdeeld zijn (en dus een klokvorm volgen), maar waarbij de onbekend is. De variantie in een t -verdeling wordt geschat op basis van het aantal vrijheidsgraden van de dataset (totaal aantal waarnemingen min 1). De t -verdeling is een variant op de, maar deze wordt gebruikt voor kleinere steekproeven, waarbij de onbekend is. Statistische power ( statistical power ) verwijst naar de waarschijnlijkheid dat een hypothesetoets een echt effect vaststelt als dat effect er is. Dit noem je ook wel het onderscheidend vermogen, Een toets met veel statistische power is beter in staat een Type II-fout ( false negative ) te voorkomen. Als je onderzoek onvoldoende power heeft, kan het voorkomen dat je geen resultaat vindt, zelfs als dit wel aanwezig is en praktische relevantie heeft. Hierdoor zou je ten onrechte de behouden. Er zijn tientallen maten voor de, De maten die het vaakst gebruikt worden zijn Cohen’s d en, Cohen’s d meet de grootte van een verschil tussen twee groepen, terwijl Pearson’s r de sterkte van een relatie tussen twee meet. Je kunt ze berekenen met behulp van statistische software (zoals ) of op basis van de, laat zien dat een effect, verschil of relatie bestaat in een onderzoek, terwijl (relevantie) laat zien dat het effect groot genoeg is om betekenisvol te zijn in de echte wereld. De statistische significantie wordt gerapporteerd met behulp van, terwijl de praktische relevantie wordt uitgedrukt met de, De laat zien hoe betekenisvol de relatie tussen of het verschil tussen groepen is. Het zegt iets over de (ook wel praktische significantie genoemd) van een onderzoeksresultaat. Een klein effect heeft weinig praktische implicaties, terwijl een groot effect juist veel praktische implicaties kan hebben. Het (alfa, α) geeft de maximale kans weer dat je de ten onrechte verwerpt (een Type I-fout). Je kiest het significantieniveau zelf voordat je een statistische toets uitvoert. Meestal kies je voor een α van 0.05 (5%) of 0.01 (1%). Praktische significantie (ook wel praktische relevantie genoemd) laat zien of de onderzoeksuitkomst belangrijk genoeg is om betekenisvol te zijn in de echte wereld. Voor deze vorm van significantie rapporteer je de effectgrootte van het onderzoek. De effectgrootte wordt gerapporteerd als aanvulling op de, Klinische significantie (ook wel klinische relevantie genoemd) is relevant voor interventie- en behandelingsstudies. Een behandeling wordt als klinisch significant beschouwd als deze het leven van patiënten tastbaar of substantieel verbetert. De klinische significantie vormt een aanvulling op, Nee, de zegt niets over de alternatieve hypothese. De p -waarde geeft aan hoe waarschijnlijk het is dat de data die je hebt gevonden zouden voorkomen als de waar zou zijn. Als de p -waarde onder je grenswaarde (vaak p < 0.05) valt, kun je de nulhypothese verwerpen, maar dit betekent niet per se dat je alternatieve hypothese waar is. De of standaardafwijking wordt afgeleid van de en vertelt je hoe ver iedere waarde gemiddeld genomen van het gemiddelde verwijderd is. Het is de vierkantswortel van de variantie. Beide maten zeggen iets over de in een verdeling, maar de eenheden verschillen:

You might be interested:  Weight Watchers Points Berekenen
  • De standaarddeviatie wordt uitgedrukt in dezelfde eenheid als de oorspronkelijke waarden (bijvoorbeeld meters).
  • De variantie wordt uitgedrukt in veel grotere eenheden (bijvoorbeeld vierkante meters).

Statistische toetsen, zoals een variantieanalyse (ook wel Analysis of Variance of genoemd), gebruiken steekproefvariantie om groepsverschillen te beoordelen. Ze gebruiken de van de om te beoordelen of de waaruit ze afkomstig zijn van elkaar verschillen.

Is een gestandaardiseerde maat voor de samenhang tussen variabelen, terwijl chi-kwadraat geen gestandaardiseerde maat is. Met de kun je enkel beoordelen of het verschil tussen twee of meerdere verdelingen van elkaar verschillen. Door de waarde voor chi-kwadraat om te zetten in Cramer’s V, kun je waarden met elkaar vergelijken.

Je kunt met behulp van de volgende vuistregels:

Waarde Cramer’s V Sterkte samenhang
Geen samenhang
0.1 Zwakke samenhang
0.3 Gemiddelde (matige) samenhang
0.5 Sterke samenhang
1 Perfecte samenhang

In de praktijk komt de waarde 0 of 1 eigenlijk nooit voor. is een maat voor de effectgrootte die informatie geeft over de statistische samenhang tussen twee of meer van, De waarde ligt tussen 0 en 1 en geeft aan hoe sterk twee categorische variabelen samenhangen.

  • De is de beste voor scheve verdelingen of datasets met uitbijters (ook wel uitschieters of genoemd).
  • De maat is gebaseerd op waarden uit de middelste helft van de dataset, waardoor het onwaarschijnlijk is dat de interkwartielafstand wordt beïnvloed door extreme waarden.
  • Het geeft je de spreiding van de gehele dataset, terwijl de je de spreiding van de middelste helft van de dataset geeft.

zeggen iets over het punt waar de meeste waarden geclusterd zijn (het midden of het centrum van je dataset). Spreidingsmaten geven informatie over de afstand tussen datapunten (hoe verspreid zijn de data). Datasets kunnen dezelfde centrale tendens hebben en een verschillende mate van spreiding (of andersom).

  • ( range ): het verschil tussen de hoogste en laagste waarde uit de dataset.
  • Interkwartielafstand ( interquartile range ): het bereik van het middelste deel van de dataset.
  • (standard deviation ): de gemiddelde afstand tussen iedere waarde in de dataset en het gemiddelde.
  • Variantie ( variance ) : de standaarddeviatie in het kwadraat.

Nee, het kan alleen 0 of een positieve waarde zijn, omdat je deze spreidingsmaat berekent door de laagste waarde van de hoogste waarde af te trekken. Het (ook wel spreidingsbreedte of range genoemd) is het interval tussen de laagste en de hoogste waarde in de dataset.

  1. Het is een veelgebruikte maat voor de spreiding ( variability ).
  2. Homoscedasticiteit houdt in dat de variantie van een variabele gelijk is voor meerdere groepen of dat de variantie van de foutterm gelijk is.
  3. Bij het uitvoeren van een of, analyseer je de variantie tussen de meerdere groepen.
  4. Dit kan getoetst kan worden met,

Bij moet de variantie van de foutterm gelijk zijn voor alle waarden van de verklarende variabele. Er mag dus niet meer of minder spreiding in de foutterm zijn voor grotere of lagere waarden van de verklarende variabele. Als er een sterk lineair verband is tussen verklarende variabelen, spreek je van multicollineariteit,

  1. Multicollineariteit kan ertoe leiden dat de regressiecoëfficiënten in je slechter worden geschat.
  2. De verklarende variabelen voorspellen elkaar dan en daardoor wordt er geen extra variantie verklaard in het regressiemodel.
  3. Voorbeeld: Je voegt zowel lengte in centimeters als lengte in inches toe als verklarende variabelen aan je regressievergelijking.

Deze twee variabelen voorspellen elkaar, aangezien lengte in centimeters 2,54 maal de lengte in inches is, en zijn dus perfect lineair gecorreleerd. Er kunnen dan geen twee regressiecoëfficiënten worden berekend. Bij het uitvoeren van een is het belangrijk dat het verband tussen de verklarende variabele en de lineair is.

  • Dit betekent dat voor zowel lage als hoge waarden van de verklarende variabele de invloed gelijk is.
  • Voorbeeld: De verklarende variabele lengte beïnvloedt de afhankelijke variabele gewicht,
  • Een lineair verband betekent dat het gewicht net zoveel toeneemt als iemand van 150 cm naar 160 cm lengte groeit als van 180 cm naar 190 cm.

In het Nederlands gebruik je komma’s als decimaalteken, terwijl je in het Engels een punt gebruikt.

  • Nederlands: De appels kosten maar €5,12.
  • Engels: The apples only cost €5.12.

Voor duizendtallen gebruik je in het Nederlands punten, terwijl je in het Engels een komma gebruikt.

  • Nederlands: De koptelefoon kost €1.600.
  • Engels: The headphones cost €1,600.

Als je, is het wel gebruikelijk om ook in het Nederlands een punt als decimaalteken te gebruiken. Dit is zeker het geval als je de gebruikt. Als je vergelijkingen wilt, moet je op de volgende punten letten:

  • Gebruik spaties, dus a + b = c in plaats van a + b = c
  • Sluit vergelijkingen af met een punt
  • Cursiveer de variabelen (in dit geval a, b en c )
  • Gebruik om de volgorde van bewerkingen aan te geven, bijvoorbeeld: (a / b) + c in plaats van a / b + c

Vergelijkingen mogen in de tekst worden geplaatst, maar gecentreerd op een aparte regel heeft de voorkeur. Nummer deze vergelijkingen, zodat je ernaar kunt verwijzen. Dit nummer is altijd rechts uitgelijnd. Om te berekenen met klik je in de menubalk op:

  1. Analyze
  2. Scale
  3. Reliability Analysis

Vervolgens selecteer je de vragen waarvan je de interne consistentie wilt meten. Zorg er daarna voor dat “Alpha” geselecteerd is. Klik vervolgens op “Statistics” en vink “Scale if item deleted” aan. Alles staat nu goed: klik nu op “Continue” en “ok” om de analyse uit te voeren. Hierbij staat s 2 ( X i ) voor de steekproefvariantie van vraag i, en s 2 ( Y ) voor de steekproefvariantie van de totale score. Je rapporteert meestal in de om aan te tonen dat je gebruikte vragenlijst betrouwbaar is. Je vermeldt het aantal items in je vragenlijst en de bijbehorende Cronbach’s alpha. Dit kun je op de volgende manier doen:

  • De klanttevredenheidsschaal is betrouwbaar, Cronbach’s alpha voor de drie items is,850.
  • De schaal voor klanttevredenheid is betrouwbaar (3 items; ⍺ =,850).

Bekijk ook ons artikel over APA-stijl richtlijnen voor het, Als je niet is, kun je kijken of je de data kunt transformeren. Het kan namelijk zijn dat een variabele zelf niet normaal verdeeld is, maar het logaritme of het kwadraat wel. Als ook dit niet het geval is, kun je niet-parametrische toetsen gebruiken, zoals de Wilcoxon- of Mann-Whitney-toets, in plaats van de,

Veel statistische toetsen, zoals een t-toets of ANOVA, kunnen alleen geldige resultaten opleveren als sprake is van een, Als je data scheef verdeeld zijn, kan het voorkomen dat je resultaten niet valide zijn. De aanname van een normale verdeling is vooral belangrijk bij steekproeven kleiner dan 30 observaties.

Als je steekproef meer dan 30 observaties bevat, dan kun je volgens de centrale limietstelling ( central limit theorem ) aannemen dat aan de aanname van normaliteit wordt voldaan. Er zijn zes stappen om de (al kun je deze maat in Excel of SPSS automatisch laten berekenen).

  1. Maak een lijst van alle scores en vind het,
  2. Trek het gemiddelde af van iedere score om de afstand (afwijking) tot het gemiddelde te berekenen.
  3. Bereken voor iedere afwijking het kwadraat.
  4. Tel alle gekwadrateerde afwijkingen bij elkaar op.
  5. Deel de som van de gekwadrateerde afwijkingen door N – 1.
  6. Trek de wortel van het gevonden nummer bij stap 5.

De ( standard deviation of s ) is de gemiddelde hoeveelheid variabiliteit in je dataset. Deze maat vertelt je hoe ver iedere score gemiddeld van het gemiddelde verwijderd is. Des te groter de standaarddeviatie, des te meer variabel je dataset is. Een is een uitbreiding van de enkelvoudige regressie waarbij twee of meer verklarende variabelen worden gebruikt om de ( Y ) te voorspellen of verklaren.

  • Je gebruikt een enkelvoudige regressieanalyse als je het effect van één op een wilt testen.
  • Voorbeeld: Je wilt aan de hand van lengte (verklarende variabele X ) iemands gewicht (afhankelijke variabele Y ) voorspellen of verklaren.
  • Een enkelvoudige regressie kan worden uitgedrukt met de volgende vergelijking:
  • Y = α + βX + u

worden gebruikt om het effect te bepalen van een (of meerdere) verklarende variabele(n), zoals lengte of leeftijd, op een zoals gewicht. Je kunt regressieanalyse gebruiken om:

  1. Samenhang tussen twee variabelen te bepalen (leeftijd en waarde van een auto)
  2. Verandering van de afhankelijke variabele te voorspellen (waarde van een auto naarmate deze ouder wordt)
  3. Toekomstige waarde te voorspellen (waarde van een zes jaar oude auto)

Je gebruikt een als je dezelfde groep respondenten meerdere malen onderzoekt () Voorbeeld: Je meet de gemiddelde lengte van respondenten in 2008, 2013, en 2018. Je vergelijkt dan de gemiddelde lengte van dezelfde persoon over een bepaalde periode om te kijken of deze verandert.

Je gebruikt een (ook wel MANOVA) als je meerdere gebruikt. Je kunt deze ANOVA zowel gebruiken met één als meerdere groepsvariabelen (onafhankelijke variabelen). Voorbeeld: Je wilt niet alleen niet alleen de gemiddelde lengte, maar ook het gemiddelde gewicht van verschillende groepen sporters vergelijken.

Je kunt beter een MANOVA uitvoeren dan meerdere losse ANOVA’s, om het risico op een Type I-fout te voorkomen. Je gebruikt een (ook wel factorial ANOVA) als je twee of meer groepsvariabelen (onafhankelijke variabelen) in je hebt. Voorbeeld: Je vergelijkt de gemiddelde lengte van verschillende typen sporters én hun gender.

Er wordt dan niet alleen getest of het gemiddelde verschilt voor volleyballers en turners en voetballers, maar ook voor mannen, vrouwen en mensen met een ander gender, én of er eventuele interactie-effecten zijn. Je gebruikt een wanneer één groepsvariabele (onafhankelijke variabele) de groepen bepaalt en er maar één is.

Voorbeeld: Je vergelijkt de gemiddelde lengte van verschillende typen sporters, zoals voetballers, turners en volleyballers. Het type sport dat iemand beoefent, is in dit geval de enige groepsvariabele en lengte is de enige afhankelijke variabele. staat voor Analysis of Variance, oftewel variantieanalyse, en wordt gebruikt om gemiddelden van meer dan twee groepen met elkaar te vergelijken.

  • Het is een uitbreiding van de, die het gemiddelde van maximaal twee groepen met elkaar vergelijkt.
  • Je gebruikt een ( paired samples t-test ) om twee gemiddelden van gepaarde met elkaar te vergelijken.
  • Gepaarde steekproeven zijn afhankelijk van elkaar.
  • Voorbeeld: Paired samples t-test Je meet de lengte van dezelfde personen in 2015 en 2018.

Deze waarden zijn afhankelijk van elkaar (omdat je dezelfde persoon meet), en daarom gebruik je een paired samples t-test. De (ook wel independent samples t-test of ongepaarde t-test genoemd) gebruik je om te onderzoeken of twee steekproefgemiddelden significant van elkaar verschillen.

Voorbeeld: Independent samples t-test Je wilt weten of de gemiddelde sprintsnelheid van kinderen uit groep 7 afwijkt van die van kinderen uit groep 8. Je gebruikt de om te analyseren of het gemiddelde van een significant verschilt van een bepaalde waarde. Voorbeeld: One sample t-test Je wilt controleren of chocoladerepen daadwerkelijk gemiddeld 300 gram wegen, zoals op de verpakking wordt vermeld.

Om dit te onderzoeken weeg je 40 repen en vergelijk je het echte gewicht met wat het zou moeten zijn (300 gram). Hiervoor gebruik je de one sample t-test. Er zijn verschillende, namelijk de:

  • One sample t-test : om te analyseren of het gemiddelde van een significant afwijkt van een bepaalde waarde.
  • Onafhankelijke t-test ( independent samples t-test ): om te onderzoeken of twee steekproefgemiddelden significant van elkaar verschillen.
  • Gepaarde t-test ( paired samples t-test ): om te onderzoeken of twee gemiddelden van gepaarde steekproeven van elkaar verschillen.

De, ook wel t-toets genoemd, wordt gebruikt om de gemiddelden van maximaal twee groepen met elkaar te vergelijken. Je kunt de t-test bijvoorbeeld gebruiken om te analyseren of moedertaalsprekers gemiddeld sneller spreken dan niet-moedertaalsprekers. Als je meer dan twee groepen wilt vergelijken, moet je een andere toets gebruiken, zoals de,

  • Je data te visualiseren
  • Je data samen te vatten met
  • Hypothesen te toetsen met inferentiële statistiek
  • De verdeling van je data te controleren ( of scheef verdeeld)
  • te berekenen
  • Andere statistische analyses uit te voeren

staat oorspronkelijk voor Statistical Package for the Social Sciences. Het is een statistisch computerprogramma ontwikkeld voor de sociale wetenschappen, maar wordt tegenwoordig ook veel gebruikt binnen andere sectoren zoals de economische wetenschappen.

  • geen enkele modus: alle waarden zijn anders
  • unimodaal: één modus
  • bimodaal: twee modi
  • trimodaal: drie modi
  • multimodaal: vier of meer modi

Je kunt de bepalen met behulp van de volgende stappen:

  1. Als je data numeriek van aard zijn, rangschik je de waarden van laag naar hoog. Als je data categorisch zijn, verdeel je de waarden over de juiste categorieën.
  2. Zoek de waarde of waarden die het vaakst voorkomen.

Om de te vinden, zet je de waarden in je dataset van laag naar hoog. Vervolgens bepaal je de middelste positie op basis van n (het aantal waarden in je dataset).

  • Als n een oneven getal is, vind je de mediaan op positie,
  • Als n een even getal is, is de mediaan het van de waarden op posities en,

De is de meest informatieve voor scheve verdelingen of verdelingen met uitbijters. De mediaan wordt bijvoorbeeld vaak gebruikt als centrummaat voor de variabele “inkomen”, die over het algemeen niet is. Aangezien je voor de mediaan slechts één of twee waarden in het midden gebruikt, wordt deze maat niet beïnvloed door extreme uitbijters of niet-symmetrische verdelingen.

  1. Bereken de som door alle waarden bij elkaar op te tellen.
  2. Deel de som door het aantal waarden in de dataset.

Deze methode werkt zowel voor, Ook maakt het niet uit of je te maken hebt met positieve (+2) of negatieve waarden (-2). (measures of central tendency) helpen je het centrum of midden van een dataset te vinden. De drie meest gebruikte centrummaten zijn het gemiddelde, de mediaan en de modus.

  • De is de waarde die het vaakst voorkomt
  • De is de middelste waarde als je de dataset van kleinste naar grootste waarde rangschikt.
  • Het is de som van alle waarden, gedeeld door het totale aantal waarden.
  • Univariate statistieken vatten één per keer samen.
  • Bivariate statistieken vergelijken twee variabelen,
  • Multivariate statistieken vergelijken drie of meer variabelen,

De drie belangrijkste hebben betrekking op de frequentieverdeling, centrale tendens en variabiliteit van de dataset.

  • Verdeling ( distribution ) verwijst naar de frequentie waarmee bepaalde antwoorden voorkomen.
  • Centrummaten ( measures of central tendency ) geven je het gemiddelde voor iedere vraag.
  • Spreidingsmaten ( measures of variability ) laten je de mate van spreiding in de dataset zien.

Statistische significantie is een term die door onderzoekers wordt gebruikt om aan te geven dat het onwaarschijnlijk is dat hun resultaten op toeval gebaseerd zijn. Significantie wordt meestal aangeduid met een p -waarde (overschrijdingskans). Statistische significantie is enigszins willekeurig, omdat je zelf de drempelwaarde (alfa) kiest. De meest voorkomende drempel is p < 0.05, wat betekent dat de kans 5% is dat de resultaten worden gevonden terwijl de waar is. Een andere drempel die vaak wordt gekozen is p < 0.01. Als de p -waarde lager is dan de gekozen alfa-waarde, mag je stellen dat het resultaat van de toets statistisch significant is. Met (ook wel descriptieve statistiek genoemd) vat je de kenmerken van een dataset samen. Met toetsende statistiek (ook wel inferentiële of verklarende statistiek genoemd) toets je een of bepaal je of je data zijn naar een bredere populatie. is de meest belangrijke methode om onderzoeksgegevens te analyseren. Hierbij wordt gebruikgemaakt van kansen en modellen om voorspellingen over een te toetsen op basis van steekproefdata. Hoewel – en beide kunnen worden gecategoriseerd, gerangschikt en gelijke afstanden hebben tussen aangrenzende waarden (gelijke intervallen), hebben alleen ratiodata een absoluut of betekenisvol nulpunt. De temperatuur in Celsius of Fahrenheit is een voorbeeld van een intervalschaal, omdat nul niet de laagst mogelijke temperatuur is. Je kunt namelijk ook nog te maken hebben met min-temperaturen. Een Kelvin-temperatuurschaal is een voorbeeld van een ratioschaal, omdat nul het absolute nulpunt is. Er zijn geen min-temperaturen. Het nominale verschilt van het ordinale meetniveau, omdat nominale data alleen gecategoriseerd kunnen worden, maar ordinale data ook gerangschikt kunnen worden. Een voorbeeld van een is "Kledingwinkels". Je kunt de data bijvoorbeeld verdelen over Zara, H&M, Only en Primark, maar je kunt die kledingwinkels niet op een natuurlijke, logische manier rangschikken. Een voorbeeld van een is "Leeftijd". Je kunt de data bijvoorbeeld verdelen over 0-18, 19-34, 35-49 en 50+, en deze categorieën kun je in een logische volgorde zetten. kunnen worden verdeeld over categorieën (waarbij ieder datapunt maar in één categorie hoort) en de categorieën kunnen niet worden gerangschikt op een logische of natuurlijke manier. Een voorbeeld van een nominale variabele is "vervoersmiddel". Deze zou bijvoorbeeld uit de categorieën fiets, auto, bus, trein, metro en tram kunnen bestaan. Die vervoersmiddelen kunnen niet op een logische manier worden geordend, want het maakt bijvoorbeeld niet uit of je start met de fiets of de auto. In het geval van een, zoals "opleidingsniveau" zou je de opleidingsniveaus vmbo, havo, vwo wel op een logische manier kunnen rangschikken. Het nominale meetniveau is het minst complexe en minst precieze, hebben twee eigenschappen:

  • De data kunnen worden verdeeld over verschillende categorieën van de variabele.
  • De categorieën kunnen op een logische, natuurlijke manier worden gerangschikt.

Het ordinale meetniveau verschilt van het intervalmeetniveau, omdat de afstand tussen twee categorieën niet gelijk is of onbekend is. Stel je hebt de categorieën beginner, gevorderde en expert. Het is niet mogelijk om aan te geven of een beginner net zoveel verschilt van een gevorderde als een gevorderde van een expert. : Hoe bereken je een p-waarde (p-value)?

Wat is de p-waarde?

De p-waarde is een maat voor de waarschijnlijkheid (E: probability) dat het gevonden resultaat van een epidemiologisch onderzoek berust op toeval. Strikt genomen is de p-waarde een maat voor de kans dat de nulhypothese ten onrechte is verworpen (en het gevonden verschil tussen onderzoeksgroepen dus in werkelijkheid op toeval berust).

Praktisch gezien is de p-waarde een waarde tussen 0 en 1, die wordt bepaald door middel van een statistische toets. Bij een p-waarde van 1 kunnen we aannemen dat het gevonden resultaat op toeval berust. Met een p-waarde dichtbij 0 kunnen we ervan uitgaan dat de gevonden waarde een werkelijke associatie aanduidt.

Gewoonlijk hanteert men p=0,05 als grens van statistische significantie. Indien p≤0,05, dan is de kans dat het gevonden resultaat aan het toeval is te wijten (en we de nulhypothese ten onrechte verwerpen) kleiner of gelijk aan 5%, dit noemt men ‘statistisch significant’.

Hoe p-waarde noteren?

Significantie rapporteren – Als je de significantie van een statistische toets, zoals de t -toets of ANOVA rapporteert, moet je rekening houden met enkele regels. De significantie wordt weergegeven met de p -waarde ( p =,076). Let bij het rapporteren op de volgende zaken:

In het Nederlands wordt normaliter een komma gebruikt als decimaalteken, in het Engels een punt Bij statistische resultaten wordt ook in het Nederlands een punt gebruikt als decimaalteken Er staat geen nul voor de komma of punt

Voor waarden kleiner dan,001 gebruik je <,001 en rond je niet af naar,000. Met een p -waarde van,000 zou je immers aangeven dat iets onmogelijk is. In tabellen wordt de significantie van een parameter vaak aangeduid met sterretjes (*). Dit geeft de lezer een snel overzicht van de parameters die significant zijn. Het aantal sterretjes geeft het significantieniveau aan. Voor p <,050 wordt één ster gebruikt, voor p <,010 twee sterren en voor p <,001 drie sterren.

Wat zegt een hoge p-waarde?

Misvattingen over de p-waarde – Enkele veel voorkomende misvattingen over de p-waarde in medisch onderzoek zijn:

Een significante p-waarde betekent dat het effect of de associatie groot of klinisch betekenisvol is. Realiteit: De p-waarde geeft alleen aan hoe waarschijnlijk het is dat het waargenomen resultaat of een extremer resultaat wordt verkregen onder de nulhypothese. Het geeft geen informatie over de grootte of de klinische betekenis van het effect of de associatie Een niet-significante p-waarde betekent dat er geen effect of associatie is. Realiteit: Een niet-significante p-waarde wijst er alleen op dat het waargenomen resultaat statistisch niet significant is, maar betekent niet noodzakelijk dat er geen effect of associatie is. Het kan het gevolg zijn van een laag statistisch vermogen of van andere factoren zoals meetfouten of verstorende factoren. Een p-waarde van 0,05 is een universele drempel voor statistische significantie. Realiteit: De keuze van het significantieniveau hangt af van de context en moet worden gebaseerd op factoren zoals de onderzoeksopzet, de steekproefomvang en de gevolgen van een type I-fout. Een lager significantieniveau kan passend zijn in sommige situaties, zoals in studies met meervoudige vergelijkingen of met een hoge inzet. Een significante p-waarde bewijst causaliteit. Realiteit: Statistische significantie geeft alleen aan hoe waarschijnlijk het is dat het waargenomen resultaat of een extremer resultaat wordt verkregen onder de nulhypothese. Het bewijst geen causaliteit, waarvoor aanvullend bewijs nodig is van de onderzoeksopzet, biologische plausibiliteit en andere factoren. Een grote steekproefomvang leidt altijd tot een significante p-waarde. Realiteit: Een grote steekproefomvang verhoogt het vermogen om een effect of associatie op te sporen, maar garandeert geen significante p-waarde. De effectgrootte, de variabiliteit en andere factoren spelen ook een rol bij het bepalen van de statistische significantie.

Wat betekent statistisch significant?

Resultaat met woordenlijst ( 1 ) – statistisch significant In de statistiek wordt hiermee bedoeld dat een gevonden resultaat (waarschijnlijk) niet op toeval berust. Bij het toetsen van significantie gaat men uit van de nulhypothese die stelt dat een gevonden associatie of verschil berust op toeval, met andere woorden dat er in werkelijkheid geen associatie of verschil bestaat.

Met behulp van een statistische toets kan deze hypothese worden getest. Wanneer de gevonden waarde in belangrijke mate afwijkt van de onder de nulhypothese verwachte waarde kunnen we de nulhypothese verwerpen. De gevonden associatie of het gevonden verschil wordt dan statistisch significant genoemd. De nauwkeurigheid van een statistisch significant resultaat wordt weergegeven door een p-waarde.

Als grenswaarde voor statistische significantie neemt men meestal p = 0,05. p-waarde Aantal resultaten : 1 artikel(s) – 3 bondige bespreking(en) De auteurs besluiten dat bij een geselecteerde groep van COPD-patiënten die voor een ernstige exacerbatie in het ziekenhuis zijn opgenomen, een kleine dosis azithromycine gedurende 3 maanden, het risico op therapiefalen kan verminderen.

  • Deze studie was methodologisch correct maar kon geen statistisch significante resultaten aantonen.
  • De werkhypothese die de auteurs wilden vooropstellen, voor patiënten die met een acute COPD-exacerbatie in het ziekenhuis opgenomen moeten worden, is nochtans klinisch belangrijk genoeg om een gelijkaardige studie met meer power in het vooruitzicht te plaatsen.

De interimresultaten van deze multicenter, dubbelblinde, placebogecontroleerde gerandomiseerde studie tonen aan dat een behandeling met enzalutamide de metastasevrije overleving statistisch significant doet toenemen bij patiënten met niet-metastatische castratieresistente prostaatkanker en snel evoluerend PSA-recidief.

  • Verder onderzoek naar winst in globale mortaliteit en levenskwaliteit en naar ongewenste effecten geassocieerd met enzalutamide is noodzakelijk.
  • Deze dubbelblinde, placebogecontroleerde studie toont aan dat toevoeging van liraglutide aan een insulinebehandeling bij type 1-diabetespatiënten leidt tot een statistisch significante daling van HbA1c, gewicht en gebruik van prandiale insuline.

De klinische relevantie van de daling in HbA1c moet verder onderzocht worden, alsook de hogere incidentie van hypoglykemie met 1,2 mg liraglutide en van hyperglykemie met 1,8 mg liraglutide. Men kan bij patiënten die klinisch verdacht zijn van een eerste diepe veneuze trombose een afwachtende houding aannemen wat het starten met antistollingstherapie betreft, wanneer een compressie-echografie negatief is en dit na 5 of 7 dagen wordt bevestigd.

Hoe bereken je een significant verschil?

Meestal kies je voor een α van 0.05 of 0.01. Bij hypothesetoetsing wordt de verkregen p-waarde (p-value) vergeleken met het significantieniveau om te bepalen of het gevonden verschil of de gevonden relatie statistisch significant is. Als de p-waarde kleiner is dan de gekozen drempelwaarde, is het resultaat significant.

Wat betekent P 0001?

Een hypothetisch voorbeeld over hypothesetoetsing – Om p-waarden goed te kunnen begrijpen, moet je weten wat we verstaan onder hypothese toetsing. Elk wetenschappelijk onderzoek begint met een hypothese. Een simpel hypothetisch voorbeeld. Stel dat iemand claimt dat mannen gemiddeld langer zijn dan vrouwen.

  1. Een tweede persoon is de advocaat van de duivel en zegt dat er geen verschil in gemiddelde lengte is tussen mannen en vrouwen.
  2. In de wetenschap moeten we net als de tweede persoon altijd kritisch zijn en gaan we er (heel pessimistisch) van uit dat we geen verschil in gemiddelde lengtes gaan vinden.
  3. De stelling van de tweede persoon noemen we dan de nulhypothese.

We willen de eerste stelling dat mannen gemiddeld langer zijn dan vrouwen onderzoeken, dit is onze alternatieve hypothese. Om dit te toetsen meet je vervolgens de lengte bij 50 mannen en 50 vrouwen. Je berekent van beide groepen de gemiddelde lengte en je ziet dat de gemiddelde lengte van de mannen 14 cm groter is dan die van de vrouwen.

Maar is dit ook statistisch significant? Je vergelijkt de twee gemiddelden met een statistische toets (t-toets) en je vindt een eenzijdige p-waarde 0,001 (1 op de 1000). Wat betekent dit? De p-waarde geeft de kans aan dat we dit verschil in lengte of groter vinden als we ervan uit gaan dat de nulhypothese waar is.

We zeiden aan het begin dat de er volgens de nulhypothese geen verschil in lengte is (0 cm). De kans dat we toch zo’n groot verschil vinden (14 cm) ervan uitgaande dat er geen verschil is in lengte, is de gevonden p-waarde. Anders gezegd, in 1 op de 1000 studies zouden we dit verschil of groter vinden puur op basis van toeval als de nulhypothese waar zou zijn.

Hoe kleiner de p-waarde?

p-waarde De p-waarde of overschrijdingskans (van een gegeven ) is de dat in de gegeven door de de in de steekproef waargenomen waarde van de wordt behaald of overschreden (links, rechts dan wel tweezijdig). De p-waarde is dus gebaseerd op de specifieke steekproefuitkomst.

  1. De p-waarde geeft aan hoe extreem de gevonden waarde voor de toetsingsgrootheid in de verdeling onder de nulhypothese is.
  2. Hoe kleiner de p-waarde, hoe extremer de uitkomst.
  3. In de praktijk worden waarden van 5% en 1% aangehouden als grens; is de p-waarde kleiner, dan spreekt men van een, resp.
  4. Sterk significante uitkomst.

De p-waarde vat als het ware de bewijskracht van de steekproefuitkomst in gestandaardiseerde vorm samen. Als T de toetsingsgrootheid is en de steekproef daarvoor de waarde t oplevert, is:

de linker overschrijdingskans:

P ( T ≤ t | H 0 ) )}

de rechter overschrijdingskans:

P ( T ≥ t | H 0 ) )}

en de tweezijdige overschrijdingskans:

2 min ( P ( T ≥ t | H 0 ), P ( T ≤ t | H 0 ) ) ),P(T\leq t|H_ ))} De p-waarde is alleen geschikt om een nulhypothese te toetsen tegen een alternatieve hypothese en doet geen uitspraak over de waarschijnlijkheid van de nulhypothese of alternatieve hypothese. Statistische toetsen die gebruikmaken van p-waarden, komt men veel tegen in met name sociale wetenschappen, medische wetenschappen en economie.

Wat houdt significantie in?

Statistische significantie is een term die door onderzoekers wordt gebruikt om aan te geven dat het onwaarschijnlijk is dat hun resultaten op toeval gebaseerd zijn. Significantie wordt meestal aangeduid met een p-waarde (overschrijdingskans).

Hoe bereken je 95% interval?

De kritieke waarde bepalen – Kritieke waarden geven aan hoeveel standaarddeviaties je van het gemiddelde verwijderd moet zijn om het gewenste betrouwbaarheidsniveau van je betrouwbaarheidsinterval te bereiken. Er zijn drie stappen om de kritieke waarde te vinden.

Kies je alfawaarde α

De alfawaarde is de drempelwaarde voor statistische significantie, De meest gebruikte alfawaarde is 0.05, maar 0.1, 0.01 en 0.001 worden soms ook gebruikt. Je kunt het beste naar gepubliceerde artikelen uit je vakgebied kijken om te beslissen welke alfawaarde je gebruikt.

Beslis of je een eenzijdig of tweezijdig interval nodig hebt

Waarschijnlijk wil je een tweezijdig interval gebruiken, tenzij je een eenzijdige t-test ( one-tailed t-test ) uitvoert. Voor een tweezijdig interval deel je je alfa door 2 om de alfawaarde voor de boven- en ondergrenzen te vinden.

Zoek de kritieke waarde op die overeenkomt met je alfawaarde

Als je data normaal verdeeld zijn of als je een grote steekproef ( n > 30) hebt die bij benadering normaal verdeeld is, kun je de z -verdeling gebruiken om je kritieke waarden te vinden. Voor een z- statistiek worden de meest voorkomende waarden in onderstaande tabel weergeven:

Betrouwbaarheidsniveau 90% 95% 99%
Alfa voor eenzijdig BI 0.1 0.05 0.01
Alfa voor tweezijdig BI 0.05 0.025 0.005
z- statistiek 1.64 1.96 2.57

Let op: BI = betrouwbaarheidsinterval (of CI = confidence interval in het Engels). Als je een kleine dataset ( n ≤ 30) gebruikt die bij benadering normaal verdeeld is, gebruik je de t- verdeling, De t -verdeling volgt dezelfde vorm als de z- verdeling maar corrigeert voor kleine steekproefgroottes.

  1. Voor de t -verdeling moet je je vrijheidsgraden kennen (steekproefgrootte min 1).
  2. Bekijk deze t -tabel om je t -statistiek te vinden.
  3. Het betrouwbaarheidsniveau en de p -waarden voor zowel eenzijdige als tweezijdige toetsen zijn toegevoegd, zodat je de benodigde waarde kunt vinden.
  4. Voor normale verdelingen, zoals de t -verdeling en de z -verdeling, is de kritieke waarde aan beide kanten van het gemiddelde gelijk.

Voorbeeld: Kritieke waarde Het onderzoek naar televisiekijken bevat meer dan 30 waarnemingen en de data volgen ongeveer een normale verdeling (klokvorm). Dit betekent dat je de z -verdeling kunt gebruiken voor je teststatistieken. Voor een tweezijdig 95%-betrouwbaarheidsinterval is de alfawaarde 0.025.

Wat is een goede betrouwbaarheidsinterval?

Betrouwbaarheidsintervallen De serie Praktische epidemiologie laat zien dat er een wetenschappelijke onderbouwing bestaat voor veel handelingen die de huisarts in de dagelijkse praktijk intuïtief uitvoert. Aan de hand van een herkenbaar praktisch gegeven in de praktijk geven we kort aan hoe de wetenschap achter dit praktijkprobleem in elkaar zit.

  1. Correspondentie: [email protected] Veel artikelen geven bij de uitkomstmaat ook betrouwbaarheidsintervallen weer.
  2. De prevalentie van ECG-afwijkingen was 17,6% (95%-BI 15,0 tot 20,1).’ Betrouwbaarheidsintervallen worden niet alleen gebruikt om schattingen weer te geven, maar bieden ook resultaten van toetsend onderzoek zoals in een randomized controlled trial.

Wat is nu de betekenis van deze betrouwbaarheidsintervallen en wat geven ze eigenlijk weer? Bij onderzoek naar bijvoorbeeld de gemiddelde diastolische bloeddruk in een populatie (schatten) is het ondoenlijk om bij alle leden van die populatie de bloeddruk te meten.

Men beperkt zich tot een steekproef die idealiter zo wordt getrokken dat ieder lid van de populatie evenveel kans heeft om erin te komen. De gemiddelde diastolische bloeddruk van die steekproef geeft een schatting van de gemiddelde diastolische bloeddruk in de hele populatie. De kans is echter groot dat een andere steekproef een andere schatting van het populatiegemiddelde zal geven.

Uit een steekproef kan men een interval rondom het steekproefgemiddelde bepalen waarin met een bepaalde mate van waarschijnlijkheid het populatiegemiddelde ligt. Meestal hanteert men het 95%-betrouwbaarheidsinterval (95%-BI) rond een steekproefgemiddelde, wat aangeeft dat met een waarschijnlijkheid van 95% het ware populatiegemiddelde zich in dit interval bevindt.

  1. Bij toetsen wordt het 95%-BI gebruikt om te bezien of een onderzoeksresultaat statistisch significant is met als drempelwaarde 5% (p-waarde &lt 0,05).
  2. Als in een onderzoek wordt gevonden dat de verhouding in risico’s op coronaire hartziekte (relatieve risico) van een diureticum ten opzichte van een placebo gelijk is aan 0,79 (95%-BI 0,69 tot 0,92), dan is dit statistisch significant omdat de waarde 1 (risico in diureticumgroep is gelijk aan die in de placebogroep) niet binnen het betrouwbaarheidsinterval valt.

Hoe wordt nu zo’n betrouwbaarheidsinterval bepaald? Een gedachte-experiment kan dit duidelijk maken. Stel: we zijn geïnteresseerd in de gemiddelde diastolische bloeddruk in een omschreven populatie. We nemen nu een steekproef in deze populatie en bepalen de gemiddelde bloeddruk en de standaarddeviatie als maat voor spreiding van de waarnemingen rond het gemiddelde (de standaarddeviatie is de rekenkundige wortel uit de variantie).

Nu gaan we in gedachten talloze malen zo’n steekproef trekken en bepalen het gemiddelde van al deze steekproefgemiddelden. De standaarddeviatie van deze gemiddelden noemt men de standaardfout (standard error, SE). De standaarddeviatie zegt iets over de variabiliteit (de spreiding) in de populatie; de standaardfout (SE) geeft de onzekerheid aan van de schatting van het (onbekende) populatiegemiddelde.

Bij een voldoende grote steekproef (30 of meer) ligt 95% van de streekproefgemiddelden in het interval rond het populatiegemiddelde. De gemiddelde diastolische bloeddruk van een steekproef van 60 personen (n) bedraagt 85 mmHg met een standaarddeviatie van 5 mmHg.

In de door het gedachte-experiment verkregen verdeling van alle steekproefgemiddelden ligt 95% van deze steekproefgemiddelden in het interval rond het populatiegemiddelde plus en min 1,3 mmHg. Natuurlijk zijn we niet zozeer geïnteresseerd in welk interval ons steekproefgemiddelde ligt, maar in welk interval het onbekende, te schatten, populatiegemiddelde ligt.

Dit interval wordt het 95%-betrouwbaarheidsinterval (95%-BI) genoemd. Bij een steekproefgemiddelde van 85 mmHg is dit dus gelijk aan =, Ook bij toetsen kunnen we een verschil in effect van een interventie versus controle schatten. Ligt de waarde die behoort bij de nulhypothese (H0, de veronderstelling dat het effect niet bestaat) in dit interval, dan wordt deze niet verworpen.

1. Scheltens T, De Beus MF, Hoes AW, Rutten FH, Numans ME, Mosterd A, et al. Een elektrocardiogram bij elke patiënt met hypertensie. Huisarts Wet 2011;54:122-7. 2. Swinscow TDV. Statistics at Square One. London: British Medical Association, 1991.

: Betrouwbaarheidsintervallen

Waarom bereken je betrouwbaarheidsinterval?

Vaak wil je dat een onderzoeksresultaat staat of geldt voor de hele populatie. Als je een steekproef trekt is het tricky om te stellen dat het je gelukt is. Daarom geef je een betrouwbaarheidsinterval. Deze geeft aan tussen welke waarden een onderzoeksuitkomst waarschijnlijk zal zitten.

  • Als je een steekproef hebt getrokken kun je er nooit zeker van zijn dat het gemiddelde van de steekproef precies overeenkomt met die van de populatie, want het is onmogelijk om uit alle mogelijk combinaties van elementen uit de populatie steeds maar weer precies hetzelfde resultaat te krijgen.
  • Stel je je eens voor dat je een populatie hebt van 1000 mensen.

Daaruit trek je een steekproef van 200 mensen en noteert van iedereen de leeftijd. Vervolgens bereken je het gemiddelde. Als je opnieuw een steekproef trekt van 200 respondenten, zal je merken dat ondanks de toets op representativiteit de gemiddelde leeftijd van de tweede steekproeftrekking iets zal verschillen van de eerste keer (al was het maar in honderdsten achter de komma).

Welke van deze twee is nu correct? Of zijn ze allebei juist? Dat kun je alleen vaststellen als je van alle 1000 mensen (de hele populatie dus) de leeftijd noteert en het gemiddelde berekent. Waarschijnlijk trek je dan de conclusie dat beide gemiddelden uit de steekproef niet correct zijn. Kortom, je kunt heel moeilijk stellen dat de gemiddelde leeftijd zoals berekend uit een steekproef precies het gemiddelde is van de populatie.

Er zit een marge tussen hetgeen je meet (het steekproefgemiddelde) en hetgeen feitelijk is (het populatiegemiddelde). Dat wil niet zeggen dat je op basis van je steekproef niets over het populatiegemiddelde kunt zeggen. Helemaal zeker kun je echter nooit zijn.

Waarom 5% significantie?

Wat is een significantieniveau? – Het, of alfa (α), is een waarde die de onderzoeker vooraf kiest als de drempel of grenswaarde voor statistische significantie. Het is het maximale risico op het trekken van een foutpositieve of valspositieve conclusie ( false positive ) dat je bereid bent te accepteren.

Als de p -waarde hoger is dan het significantieniveau, wordt de nulhypothese niet weerlegd en zijn de resultaten niet statistisch significant, Als de p -waarde lager is dan het significantieniveau, worden de resultaten geïnterpreteerd als een weerlegging van de nulhypothese en gerapporteerd als statistisch significant,

Meestal wordt het significantieniveau ingesteld op 0.05 (5%). Dat betekent dat de resultaten onder de nulhypothese een kans van 5% of minder moeten hebben om als statistisch significant te worden beschouwd. Het significantieniveau kan worden verlaagd voor een meer conservatieve (strengere) toets.

  1. Dat betekent dat een effect groter moet zijn om statistisch significant te zijn.
  2. Meestal wordt dan gekozen voor een significantieniveau van 0.01 (1%).
  3. Het significantieniveau kan ook hoger worden ingesteld voor significantietesten in niet-academische contexten, zoals voor marketingonderzoek of ander zakelijk onderzoek.

Dit maakt het onderzoek minder streng en vergroot de kans dat je een statistisch significant resultaat vindt. Let op Het is een best practice om het significantieniveau te kiezen voordat je met je onderzoek begint. Als je dit niet doet, kun je je resultaten zo manipuleren dat ze kloppen met je voorspellingen.

Het is belangrijk om je ervan bewust te zijn dat je op basis van hypothesetoetsing alleen kunt concluderen dat je de nulhypothese verwerpt (en daarom de alternatieve hypothese aanneemt). Je kunt de alternatieve hypothese niet bewijzen met hypothesetoetsen, omdat het gebrek aan een statistisch significant effect niet betekent dat er geen effect kan bestaan.

Voorbeeld: Conclusies trekken Je statistische toets geeft een p -waarde van 0.0029. Aangezien deze p -waarde lager is dan je significantieniveau van 0.05, beschouw je de resultaten als statistisch significant en verwerp je de nulhypothese. Dat betekent dat het verschil in geluksniveau van de verschillende groepen kan worden toegeschreven aan de experimentele manipulatie.

Als je de statistische significantie rapporteert, is het verstandig om relevante te gebruiken om je data samen te vatten. Voorbeelden hiervan zijn en, Ook vermeld je de teststatistiek en p -waarde. Statistische significantie rapporteren De experimentele groep ( M = 4.67, SD = 2.14) rapporteerde een significant hogere geluksscore dan de controlegroep ( M = 3.81, SD = 1.92), t (108) = 2.22, p =,0029.

Dit was in lijn met de alternatieve hypothese. Professionele Scribbr-editors kijken je scriptie na op:

Academisch taalgebruik Onduidelijke zinnen Grammaticale fouten Interpunctie Verboden woorden

Wat als iets niet significant is?

In wetenschappelijke artikelen is geregeld te lezen dat de resultaten ‘net niet significant’ waren. Meestal betekent dit dat de waarde van de statistische grootheid p vlak boven de 0,05 lag.

Wat als er geen significant verschil is?

statistiek Nagegaan kan worden hoe groot de kans is dat een gevonden verschil tussen de gemiddelden van twee steekproeven veroorzaakt is door toeval. De kans (probability) dat een verschil tussen twee gemiddelden door toeval is ontstaan, wordt weergegeven als een breuk.

  • Als p = 0.1 dan betekent dat, dat er 10% kans is dat het gevonden verschil door toeval is ontstaan en dus 90% kans dat het een echt verschil is.
  • Omdat ieder verschil, ook al is het nog zo groot, ontstaan kan zijn door toeval, heeft men ergens een kunstmatige grens getrokken.
  • Als de kans, dat een verschil door toeval ontstaan is, kleiner is dan 5% (p = 0.05), dan noemt men het verschil significant (betekenisvol).

Als de kans, dat het verschil door toeval ontstaan is, kleiner is dan 1% (p = 0.01 ) dan noemt men het verschil zeer significant (zeer betekenis vol). De kans op toeval is dan wel erg klein. Let op !!!!!!!!

Als je met de t-toets geen significant verschil kan aantonen, dan wil dat nog niet zeggen dat er geen verschil is, maar alleen dat het door jouw onderzoek niet aangetoond is. Als je met deze toets wel een betekenisvol (significant) verschil aantoont, dan wil dat alleen maar zeggen dat de kans dat het door jou gevonden verschil door toeval ontstaan is, klein is. Voorwaarde voor toepassing van de t-toets: de standdaarddeviaties van de twee te onderzoeken groepen moeten ongeveer even groot zijn!

Wat houdt statistisch significant in?

Resultaat met woordenlijst ( 1 ) – statistisch significant In de statistiek wordt hiermee bedoeld dat een gevonden resultaat (waarschijnlijk) niet op toeval berust. Bij het toetsen van significantie gaat men uit van de nulhypothese die stelt dat een gevonden associatie of verschil berust op toeval, met andere woorden dat er in werkelijkheid geen associatie of verschil bestaat.

Met behulp van een statistische toets kan deze hypothese worden getest. Wanneer de gevonden waarde in belangrijke mate afwijkt van de onder de nulhypothese verwachte waarde kunnen we de nulhypothese verwerpen. De gevonden associatie of het gevonden verschil wordt dan statistisch significant genoemd. De nauwkeurigheid van een statistisch significant resultaat wordt weergegeven door een p-waarde.

Als grenswaarde voor statistische significantie neemt men meestal p = 0,05. p-waarde Aantal resultaten : 1 artikel(s) – 3 bondige bespreking(en) De auteurs besluiten dat bij een geselecteerde groep van COPD-patiënten die voor een ernstige exacerbatie in het ziekenhuis zijn opgenomen, een kleine dosis azithromycine gedurende 3 maanden, het risico op therapiefalen kan verminderen.

  • Deze studie was methodologisch correct maar kon geen statistisch significante resultaten aantonen.
  • De werkhypothese die de auteurs wilden vooropstellen, voor patiënten die met een acute COPD-exacerbatie in het ziekenhuis opgenomen moeten worden, is nochtans klinisch belangrijk genoeg om een gelijkaardige studie met meer power in het vooruitzicht te plaatsen.

De interimresultaten van deze multicenter, dubbelblinde, placebogecontroleerde gerandomiseerde studie tonen aan dat een behandeling met enzalutamide de metastasevrije overleving statistisch significant doet toenemen bij patiënten met niet-metastatische castratieresistente prostaatkanker en snel evoluerend PSA-recidief.

Verder onderzoek naar winst in globale mortaliteit en levenskwaliteit en naar ongewenste effecten geassocieerd met enzalutamide is noodzakelijk. Deze dubbelblinde, placebogecontroleerde studie toont aan dat toevoeging van liraglutide aan een insulinebehandeling bij type 1-diabetespatiënten leidt tot een statistisch significante daling van HbA1c, gewicht en gebruik van prandiale insuline.

De klinische relevantie van de daling in HbA1c moet verder onderzocht worden, alsook de hogere incidentie van hypoglykemie met 1,2 mg liraglutide en van hyperglykemie met 1,8 mg liraglutide. Men kan bij patiënten die klinisch verdacht zijn van een eerste diepe veneuze trombose een afwachtende houding aannemen wat het starten met antistollingstherapie betreft, wanneer een compressie-echografie negatief is en dit na 5 of 7 dagen wordt bevestigd.

Wat betekent P 0001?

Een hypothetisch voorbeeld over hypothesetoetsing – Om p-waarden goed te kunnen begrijpen, moet je weten wat we verstaan onder hypothese toetsing. Elk wetenschappelijk onderzoek begint met een hypothese. Een simpel hypothetisch voorbeeld. Stel dat iemand claimt dat mannen gemiddeld langer zijn dan vrouwen.

  1. Een tweede persoon is de advocaat van de duivel en zegt dat er geen verschil in gemiddelde lengte is tussen mannen en vrouwen.
  2. In de wetenschap moeten we net als de tweede persoon altijd kritisch zijn en gaan we er (heel pessimistisch) van uit dat we geen verschil in gemiddelde lengtes gaan vinden.
  3. De stelling van de tweede persoon noemen we dan de nulhypothese.

We willen de eerste stelling dat mannen gemiddeld langer zijn dan vrouwen onderzoeken, dit is onze alternatieve hypothese. Om dit te toetsen meet je vervolgens de lengte bij 50 mannen en 50 vrouwen. Je berekent van beide groepen de gemiddelde lengte en je ziet dat de gemiddelde lengte van de mannen 14 cm groter is dan die van de vrouwen.

  1. Maar is dit ook statistisch significant? Je vergelijkt de twee gemiddelden met een statistische toets (t-toets) en je vindt een eenzijdige p-waarde 0,001 (1 op de 1000).
  2. Wat betekent dit? De p-waarde geeft de kans aan dat we dit verschil in lengte of groter vinden als we ervan uit gaan dat de nulhypothese waar is.

We zeiden aan het begin dat de er volgens de nulhypothese geen verschil in lengte is (0 cm). De kans dat we toch zo’n groot verschil vinden (14 cm) ervan uitgaande dat er geen verschil is in lengte, is de gevonden p-waarde. Anders gezegd, in 1 op de 1000 studies zouden we dit verschil of groter vinden puur op basis van toeval als de nulhypothese waar zou zijn.

Hoe interpreteer je een betrouwbaarheidsinterval?

Het betrouwbaarheidsinterval (Engels confidence interval (CI)) wordt gebruikt om aan te geven hoe zeker je bent van een geschatte waarde. Het is een interval waar binnen je verwacht dat de werkelijke waarde ligt. Formeel zegt het interval iets over welke waardes verwacht worden als een experiment meerdere keren herhaald zou worden.