Hep bir ağızdan ‘ne alakası var yahu’ dediğinizi duyar gibiyim. ‘Espresso | Hızlı ve Faydalı’ serimizin bugünkü buluşmasında iki değişken arasındaki seyrin birbirine benzese de her zaman birbirine sebep teşkil etmediğini anlatalım. İngilizcede ve literatürde ‘correlation does not imply causality’ olarak bilinen Türkçeye ‘korelasyon nedensellik değildir’ diye çevirebileceğimiz yalancı nedensellik hallerine gelin bir göz atalım.
Korelasyon tanım olarak istatistikte iki rassal değişken arasındaki doğrusal ilişkinin yönünü ve gücünü belirten bir terim. -1 ila +1 arasında bir değer alan korelasyon, değişkenler arasında negatif veya pozitif yönlü bir doğrusal ilişkiyi ifade ediyor. Katsayı +1’e veya -1’e ne kadar yakınsa ilişkinin doğrusallığı o kadar güçlüdür.
Nedensellik ise istatistiki yöntemlerle ölçülen, ölçtüğünüz sav istatistiki olarak reddedilmediği takdirde değişkenlerin birbirinin sebebi olduğunu ifade eden bir terim. Nedenselliğin yönünü bile sınamanız mümkün. Örneğin, X ve Y değişkenlerinizden X’in mi Y’nin nedeni olduğu yoksa ilişkinin tam tersi mi ya da çift yönlü mü olduğunu sınamanız mümkün. Detaylara girip de dikkatimizi dağıtmayalım.
Gelelim mozzarella peyniri ile mühendislik diploması arasındaki ilişkiye. Kulağa gülünç gelse de birbiriyle alakasız ancak rassal bir şekilde dağılan iki değişkenin doğrusal ilişkisi yüksek çıkabilir. Ancak bu iki değişken arasında bir nedensellikten söz etmek bizi müthiş bir yanılgıya savurabilir. Mesela aşağıda örneğini görebileceğimiz ilişkiye bir bakalım:

Siyah çizgi inşaat mühendisliği diplomalarının sayısını gösterirken kırmızı çizgi ise kişi başına mozzarella peyniri tüketimini gösteriyor. İki değişken arasındaki korelasyon katsayısı 0,96. Yani pozitif yönlü %96 oranında güçlü bir doğrusal ilişki var. Ama tabii ki bu iki değişken herhangi bir nedensellik ihtiva etmiyor. Yani mozzarella peyniri tüketimi mühendislik diplomasını beraberinde getirmiyor.
Espresso serimizi birazcık ihmal etmiştik, özlemişiz. Peki kahveler bitti mi? Afiyet olsun.
