Nie wszystko złoto, co się świeci: czyli czym są korelacje pozorne
- Karolina Dyrla-Mularczyk
- 18 sie 2024
- 1 minut(y) czytania
Zaktualizowano: 3 dni temu
Współwystępowanie dwóch (lub więcej) zmiennych w określonej sytuacji nie zawsze oznacza, że są one ze sobą powiązane. Czasem to kwestia przypadku, zbiegu okoliczności, zbieżności czasowej lub wpływu innej zmiennej.
Korelacje pozorne w świetle badań
Istnienia korelacji pozornych dowiedli w swoim eksperymencie już w latach 90. XX w. Donald Redelmeier i Amos Tversky. Badacze obserwowali przez 15 miesięcy 18 pacjentów chorych na zwyrodnieniową chorobę stawów. W tym samym czasie rejestrowali dane dotyczące pogody (ciśnienie, temperaturę, wilgotność). Pacjenci byli przekonani, że istnieje związek między pogodą a zwiększeniem się bólu w stawach. Analizy statystyczne jednak tego nie potwierdziły.
W jednej z moich ostatnich analiz czynnikiem korelującym z udarem mózgu było bycie w związku małżenskim. Czy jednak to prawdziwa korelacja? Nie, gdyż zmienną, która faktycznie koreluje z wystąpieniem udaru jest wiek pacjenta. Wraz z wiekiem pacjentów rosło prawdopodobieństwo bycia w związku małżeńskim. Zatem wiek pacjentów był w tej relacji tzw.zmienną zakłócającą.

Korelacje pozorne - inne przykłady:
rosnącym wydatkom na zwierzęta domowe towarzyszy rosnąca liczba zgonów spowodowanych upadkiem ze schodów;
w latach, gdy aktor Nicolas Cage grał w większej liczbie filmów - równolegle rosła liczba osób, które utonęły w przydomowych basenach.
Więcej pozornych, ale silnych korelacji, można znaleźć na stronie: https://plotlygraphs.medium.com/spurious-correlations-56752fcffb69
By uniknąć błędnych wniosków dotyczących korelacji, należy:
Zweryfikować, czy istnieje logiczne i spójne wyjaśnienie przyczynowości między zmiennymi.
Kontrolować zmienne zakłócające - zidentyfikować i kontrolować potencjalne zmienne, które mogą wpływać na analizowane zmienne.
Wykorzystać zaawansowane metody analizy statystycznej, takie jak analiza regresji, aby kontrolować wpływ zmiennych zakłócających.
Chcesz uniknąć tej lub innych pułapek statystycznych i potrzebujesz pomocy w swojej pracy badawczej? Napisz do nas!