Korrelation och kausalitet

Diskutera allmänt om vetenskap, pseudovetenskap och folkbildning, t.ex. vetenskapsteori eller forskningspolitik.
Skriv svar
Användarvisningsbild
Erland
Inlägg: 3433
Blev medlem: lör 19 nov 2005, 21:08
Ort: Karlskoga

Korrelation och kausalitet

Inlägg av Erland » ons 20 jan 2016, 21:56

Om man sysslar med statistik ska man inte blanda ihop korrelation med kausalitet, det varnas man med rätta för. T.ex. finns det en korrelation mellan skolbarns fotstorlek och läsförmåga: ju större fötter, desto bättre läser barnet. Man kan då förledas att tro att större fotstorlek orsakar bättre läsförmåga, men så är det naturligtvis inte. Den enkla förklaringen är istället att både fotstorleken och läsförmågan har en gemensam orsak: ålder! Ju äldre ett barn är, desto större fötter har det, och desto bättre läser det (i genomsnitt).

Så man ska akta sig för att tro att bara för att det finns en korrelation mellan variablerna A och B, så orsakas A av B, eller B av A. Men vilken slutsats kan man då dra av att det finns en korrelation mellan A och B? Måste det inte förklaras på något sätt? Det kan ju ändå inte bero på slumpen, annat än undantagsvis. Och då måste det ju ha en förklaring av något slag. Om varken A orsakas av B eller B av A, så kan jag inte se någon annan återstående möjlighet än att både A och B orsakas av något tredje, C, som i fallet ovan där åldern orsakade både fotstorleken och läsförmågan, eller flera sådana orsaker C1, C2, C3, etc.... Det kan förstås också röra sig om kombinationer av två eller alla tre fallen: A orsakas av B, B av A, både A och B av C (eller C1, C2, C3....)

Så även om man inte kan dra slutsatsen att om det finnas någon korrelation mellan A och B så orsakas A av B, så borde man kunna dra slutsatsen att det finns någon orsak till korrelationen, enligt ovan... eller vad säger ni?

Användarvisningsbild
micke.d
Forummoderator
Inlägg: 13375
Blev medlem: tis 05 jan 2010, 19:02
Ort: Ultima Thule

Re: Korrelation och kausalitet

Inlägg av micke.d » ons 20 jan 2016, 22:19

Erland skrev:Om man sysslar med statistik ska man inte blanda ihop korrelation med kausalitet, det varnas man med rätta för. T.ex. finns det en korrelation mellan skolbarns fotstorlek och läsförmåga: ju större fötter, desto bättre läser barnet. Man kan då förledas att tro att större fotstorlek orsakar bättre läsförmåga, men så är det naturligtvis inte. Den enkla förklaringen är istället att både fotstorleken och läsförmågan har en gemensam orsak: ålder! Ju äldre ett barn är, desto större fötter har det, och desto bättre läser det (i genomsnitt).

Så man ska akta sig för att tro att bara för att det finns en korrelation mellan variablerna A och B, så orsakas A av B, eller B av A. Men vilken slutsats kan man då dra av att det finns en korrelation mellan A och B? Måste det inte förklaras på något sätt? Det kan ju ändå inte bero på slumpen, annat än undantagsvis. Och då måste det ju ha en förklaring av något slag. Om varken A orsakas av B eller B av A, så kan jag inte se någon annan återstående möjlighet än att både A och B orsakas av något tredje, C, som i fallet ovan där åldern orsakade både fotstorleken och läsförmågan, eller flera sådana orsaker C1, C2, C3, etc.... Det kan förstås också röra sig om kombinationer av två eller alla tre fallen: A orsakas av B, B av A, både A och B av C (eller C1, C2, C3....)

Så även om man inte kan dra slutsatsen att om det finnas någon korrelation mellan A och B så orsakas A av B, så borde man kunna dra slutsatsen att det finns någon orsak till korrelationen, enligt ovan... eller vad säger ni?
Det finns en positiv korrelation mellan årlig försäljning av ekologisk mat och autismfall. Vilket är C?
Hädanefter kallar jag dem Daesh.

Användarvisningsbild
Erland
Inlägg: 3433
Blev medlem: lör 19 nov 2005, 21:08
Ort: Karlskoga

Re: Korrelation och kausalitet

Inlägg av Erland » ons 20 jan 2016, 22:29

micke.d skrev:Det finns en positiv korrelation mellan årlig försäljning av ekologisk mat och autismfall. Vilket är C?
Jag vet inte, men det borde finnas något sådant. Kanske ökande befolkning (C) orsakar båda delarna? Eller kanske ekologisk mat orsakar någon sorts bristsjukdom som orsakar autism (A orsakar B), eller kanske föräldrar med autistiska barn tror att autismen orsakas av dålig mat, och därför ger barnet ekologisk mat som de tror är nyttigare (B orsakar A)?
För det måste finnas någon förklaring till korrelationen...

Cytokrom C
Inlägg: 297
Blev medlem: sön 18 mar 2007, 17:00

Re: Korrelation och kausalitet

Inlägg av Cytokrom C » ons 20 jan 2016, 22:41

Om man fördefinierar vilka korrelationer man vill undersöka och kompenserar för multiplicitet i analysen kan man behålla kontroll över typ I felet och då finns det nog fog för Erlands slutsats. Om man bara letar korrelationer planlöst som kanske Mickes exempel illustrerar(?) är det svårt att dra några slutsatser baserat på en korrelation då den lika gärna kan vara slumpmässig...

Användarvisningsbild
Erland
Inlägg: 3433
Blev medlem: lör 19 nov 2005, 21:08
Ort: Karlskoga

Re: Korrelation och kausalitet

Inlägg av Erland » ons 20 jan 2016, 22:46

Cytokrom C skrev:Om man fördefinierar vilka korrelationer man vill undersöka och kompenserar för multiplicitet i analysen kan man behålla kontroll över typ I felet och då finns det nog fog för Erlands slutsats. Om man bara letar korrelationer planlöst som kanske Mickes exempel illustrerar(?) är det svårt att dra några slutsatser baserat på en korrelation då den lika gärna kan vara slumpmässig...
Ja det är sant förstås, om det är en korrelation man råkar hitta i en enda undersökning där det finns många variabler så kan den vara slumpmässig. Men för att säga att det verkligen finns en korrelation ska det finns flera undersökningar och det ska hålla även för nästa undersökning...

Användarvisningsbild
ttias
Inlägg: 1983
Blev medlem: ons 22 dec 2004, 21:13
Ort: Stockholms skägg

Re: Korrelation och kausalitet

Inlägg av ttias » tor 21 jan 2016, 09:11

Erland; jag vill rekomendera sidan spurious correlation; http://www.tylervigen.com/spurious-correlations Jag tror att den kan ge nya perspektiv och utmana din syn på att alla korrelationer rimligen har en underliggande variabel.

Där kan man lära sig om den starka korrelationen mellan per capita ostätande och antal döda genom intrassling i lakan. Eller den något svagare korrelationen mellan Nicolas Cage filmer och drunkningar i svimmingpooler :)
Med ett leende på läpparna och foliehatten på sned.

Användarvisningsbild
Zartax
Inlägg: 3406
Blev medlem: mån 05 nov 2007, 19:07

Re: Korrelation och kausalitet

Inlägg av Zartax » tor 21 jan 2016, 10:08

Det enkla svaret är att det finns väldigt många saker att mäta som ger en graf och några av dessa grafer kommer, statistiskt sett, korrelera, trots att de saknar gemensamma nämnare.

Ex: Slår du 10000 T6 5 gånger så kommer några av dessa få samma utfall alla 5 gångerna. Betyder detta att de har en gemensam orsak till sina specifika utfall? Nej.
"Jag är hälften grekisk gud, hälften sabeltandad tiger." - Thunder

tonyf
Inlägg: 2440
Blev medlem: sön 05 nov 2006, 23:57

Re: Korrelation och kausalitet

Inlägg av tonyf » tor 21 jan 2016, 11:16

Man får skilja mellan att korrelation föreligger i ett ändligt antal utfall och i ett oändligt antal (oberoende) utfall. I det förstnämnda fallet kan en korrelation bero på slumpen, i det andra fallet inte. I det andra fallet återstår då förmodligen endast två möjligheter ("argument from ignorance"? kanske någon hittar en tredje möjlighet) : korrelationen beror på ett kausalt samband, korrelationen beror inte på någonting utan korrelation bara finns, är det grundläggande i universum inte kausalitet (huruvida kausalitet existerar eller ej i vårt universum är ju en öppen fråga (samma gäller slumpen), dock kan man nog ganska säkert säga att både kausalitet och slump (oavsett om de finns eller ej på grundläggande nivå) att de finns som goda högnivåkonstruktioner i många stora komplexa system (och allt vi människor kunnat empiriskt observera än så länge är sådana)).

I många fall försöker man bedöma huruvida korrelation föreligger i en oändligt stor befolkning genom att ta ett ändligt stort slumpmässigt draget stickprov. Stickproven har då statistiska avvikelser från befolkningen. Att beräkna hur stora dessa är, är en standarduppgift inom statistik. Man kan aldrig från att ett stickprov har korrelation säga helt säkert att detta inte bara är p.g.a. slump i hur (ändligt stora) stickprovet råkade bli draget och inte p.g.a. faktisk korrelation i befolkningen, men man kan säga en hel del om hur stor risken att den observerade korrelationen bara var en statistisk avvikelse är.

Standarmetoden för att påvisa kausal påverkan är att göra kontrollerade experiment. Man ger olika grupper olika behandlingar, där vilken individ som skall få vilken behandling (= vilka individer som plockas in till vilken behandlingsgrupp) väljs helt okorrelerat till alla andra relevanta paramerar i studien (och detta val blindas så att inte den kausala påverkan är att de vet till vilken grupp de plockats etc.). Man kan aldrig vara helt säker i princip på att de är okorrelerat utvalda till alla andra parametrar i studien. Men om de valdes slumpmässigt så vet man att de är oberoende av alla andra parametrar (rent definitionsmässigt förmodligen, definiera "slumpmässigt" som att det är helt statistiskt oberoende av alla andra parametrar), och att välja behandlingarna med en god pseudoslumptalsgenerator är därför "i praktiken" (förmodligen) (i de flesta fall) tillräckligt bra för att avgöra huruvida man har en kausal påverkan från behandlingen. Enda fallet jag känner till där det finns seriösa tvivel på att utval med god pseudoslumptalsgenerator verkligen är okorrelerat till andra relevanta variabler i studien är i tester av Bells olikhet, men man bör alltid vara försiktig i tolkningarna ty vi vet i princip inte hur slumpmässiga våra så-kallade slumptalsgeneratorer verkligen är. (För tvivel på grundläggande principiell nivå är tester av Bells olikhet det enda exempel jag känner, men tvivelaktiga resultat p.g.a. slarvigt utförda studier är däremot vanligt.)

Förutom standarmetoden kontrollerade experiment så finns det (ganska) nya teoretiska resultat om slutsatser om kausalitet från okontrollerade observationsstudier av filosofen Judea Pearl. Jag har inte hunnit sätta mig in i dem. Någon här på tråden som har?
"philosophy without science is blind, science without philosophy is lame" (tonyf)

tonyf
Inlägg: 2440
Blev medlem: sön 05 nov 2006, 23:57

Re: Korrelation och kausalitet

Inlägg av tonyf » tor 21 jan 2016, 11:32

Erland skrev:
micke.d skrev:Det finns en positiv korrelation mellan årlig försäljning av ekologisk mat och autismfall. Vilket är C?
Jag vet inte, men det borde finnas något sådant. Kanske ökande befolkning (C) orsakar båda delarna? Eller kanske ekologisk mat orsakar någon sorts bristsjukdom som orsakar autism (A orsakar B), eller kanske föräldrar med autistiska barn tror att autismen orsakas av dålig mat, och därför ger barnet ekologisk mat som de tror är nyttigare (B orsakar A)?
För det måste finnas någon förklaring till korrelationen...
Dina spekulativa kausala orsakar verkar rimliga. Men det är ett ändligt antal fall, så det kan mycket väl vara slumpen. Hur stor möjlighet det är slumpen skulle man kunna beräkna med standard statistiska metoder (om det är goda studier och om man känner alla rådata från studierna).
"philosophy without science is blind, science without philosophy is lame" (tonyf)

Användarvisningsbild
Erland
Inlägg: 3433
Blev medlem: lör 19 nov 2005, 21:08
Ort: Karlskoga

Re: Korrelation och kausalitet

Inlägg av Erland » tor 21 jan 2016, 19:20

Intressanta inlägg. Jovisst kan man hitta slumpmässiga korrelationer om man bara letar tillräckligt länge. De roande exemplen som ges i ttias' länk torde vara typexempel på detta. Men jag noterar också att det i alla de exemplen finns mycket få datapunkter, bara ett tiotal i varje exempel, och man kan inte i de fallen göra upprepade försök. Det var väl snarare fall där det finns gott om data och försök som kan upprepas med samma resultat jag var ute efter.
Bra utredning tonyf!

ÄrDetVerkligenSant?
Inlägg: 23
Blev medlem: fre 02 maj 2014, 16:39

Re: Korrelation och kausalitet

Inlägg av ÄrDetVerkligenSant? » tor 21 jan 2016, 22:16

Först och främst måste jag säga att det är orsaken som är intressant inte korrelationen. Hittar man en korrelation utan att fastslå en bestämd orsak är man inte klar! Att säga "Det finns någon orsak" duger inte. Det är bara att kavla upp armarna och jobba vidare.
Erland skrev:
Så även om man inte kan dra slutsatsen att om det finnas någon korrelation mellan A och B så orsakas A av B, så borde man kunna dra slutsatsen att det finns någon orsak till korrelationen, enligt ovan... eller vad säger ni?
Jag har tolkar din fråga så här:
"Om det finns en korrelation, måste det väl finnas en någon orsak till korrelationen?"

Så som jag har tolkat frågan måste jag svara "Ja". Det måste finnas en orsak till korrelationen, men att bara säga "Det finns någon orsak" gör att orsakssambandet tas för lättvindigt.

Dessutom ser jag inte hur man ska kunna veta vilka begränsningar som finns om man inte har orsaken klar för sig. Hur ska man kunna veta/uppskatta när är korrelationen upphör.

Det som är viktigt för mig när jag undersöker korrelationer är att kunna bygga en modell och med den kunna förutsäga ett beteende.

I exemplet fotstorlek och läsförståelse skapar du en modell där du förutser läsförståelse genom att mäta fotstorleken. Antag att vi måste förutse elevernas läsförståelse och det enda vi har är en linjal... och deras fötter!?!? I brist på bättre kan man mycket väl använda modellen, men modellen har sina begränsningar och det får man inte glömma bort.

Förresten, om det inte finns en korrelation, måste det väl även där finnas en någon orsak till den obefintliga korrelationen? :smile2:

Skriv svar