top of page

Nie wszystko złoto, co się świeci: czyli czym są korelacje pozorne

  • Zdjęcie autora: Karolina Dyrla-Mularczyk
    Karolina Dyrla-Mularczyk
  • 18 sie 2024
  • 1 minut(y) czytania

Zaktualizowano: 3 dni temu

Współwystępowanie dwóch (lub więcej) zmiennych w określonej sytuacji nie zawsze oznacza, że są one ze sobą powiązane. Czasem to kwestia przypadku, zbiegu okoliczności, zbieżności czasowej lub wpływu innej zmiennej.

  

Korelacje pozorne w świetle badań

Istnienia korelacji pozornych dowiedli w swoim eksperymencie już w latach 90. XX w. Donald Redelmeier i Amos Tversky. Badacze obserwowali przez 15 miesięcy 18 pacjentów chorych na zwyrodnieniową chorobę stawów. W tym samym czasie rejestrowali dane dotyczące pogody (ciśnienie, temperaturę, wilgotność). Pacjenci byli przekonani, że istnieje związek między pogodą a zwiększeniem się bólu w stawach. Analizy statystyczne jednak tego nie potwierdziły.  


W jednej z moich ostatnich analiz czynnikiem korelującym z udarem mózgu było bycie w związku małżenskim. Czy jednak to prawdziwa korelacja? Nie, gdyż zmienną, która faktycznie koreluje z wystąpieniem udaru jest wiek pacjenta. Wraz z wiekiem pacjentów rosło prawdopodobieństwo bycia w związku małżeńskim. Zatem wiek pacjentów był w tej relacji tzw.zmienną zakłócającą. 


Korelacje pozorne
Photo by svklimkin on Unsplash


Korelacje pozorne - inne przykłady:  

  • rosnącym wydatkom na zwierzęta domowe towarzyszy rosnąca liczba zgonów spowodowanych upadkiem ze schodów; 

  • ​​w latach, gdy aktor Nicolas Cage grał w większej liczbie filmów - równolegle rosła liczba osób, które utonęły w przydomowych basenach.


 Więcej pozornych, ale silnych korelacji, można znaleźć na stronie: https://plotlygraphs.medium.com/spurious-correlations-56752fcffb69 


By uniknąć błędnych wniosków dotyczących korelacji, należy: 

  • Zweryfikować, czy istnieje logiczne i spójne wyjaśnienie przyczynowości między zmiennymi. 

  • Kontrolować zmienne zakłócające - zidentyfikować i kontrolować potencjalne zmienne, które mogą wpływać na analizowane zmienne. 

  • Wykorzystać zaawansowane metody analizy statystycznej, takie jak analiza regresji, aby kontrolować wpływ zmiennych zakłócających. 

   


Chcesz uniknąć tej lub innych pułapek statystycznych i potrzebujesz pomocy w swojej pracy badawczej? Napisz do nas!



bottom of page