Türkiye’de matematiğin kullanımının ötesinde sayısal göstergeler ve dolayısıyla istatistiklerle toplum arasında hastalıklı bir ilişki olduğunu söyleyebiliriz. Hastalık özellikle istatistiksel okuryazarlığın istatistik üreten kurumlar dahil neredeyse sıfıra yakın olmasından ve sayısal ve grafik gösterimler konusunda ise son derece sığ bir bilgiye sahip olmamızdan kaynaklanıyor.
Buna karşın sayısal olana güven ve sarsılmaz ancak seçmeli inanç neredeyse sınırsız. İstatistiksel üretimin kurumsal kaynağı TÜİK’e güvenilmezken aynı ölçüde yanlış istatistik üreten başka kurumlar ilan ettikleri ölçüm ve sonuçlar bireysel beklentilerle örtüştüğü sürece en popüler kurum haline dönüşebiliyorlar.
Her vatandaşın, kurumun ve siyasi partinin ise kendine has güvenilir anketçisi var. Bu karmaşık ortamda karar vermek için bir ölçüde istatistiksel temel bilgiye ve çokça sağduyulu ve amaca dönük değerlendirmelere ihtiyacımız var.
Uzun zamandır Türkiye’de adım adım örülen yolsuzluk ve talan düzeninin ve otoriterleşmenin ulaştığı seviye bizi büyük bir ekonomik ve toplumsal yıkımın eşiğine getirdi. Bu koşullar altında 14 Mayıs’ta yapılacak seçimi kaybetmek Türkiye’de toplumsal bağların çözülmesi ve “çökmüş devlet (failed state)” konumuna düşme ihtimalini gündeme getirecek kadar büyük bir risk taşıyor.
***
Öncelikle saha çalışmalarındaki durumu ele almakta fayda var. Detaylarına girmeden önce Sabancı Üniversitesi’nden üç araştırmacının 2022’de yayımladıkları bir makaleye değinmek gerek.
2011 – 2019 yılları arasındaki sekiz seçim için kırk yedi firma tarafından gerçekleştirilen 295 seçim anketinden hareketle “toplam anket hatası” yaklaşımı ve CNN’in “şeffaflık kriterleri” ışığında yapılan istatistiksel tahminlerin sonucuna göre, “… bilimsellik ve şeffaflık standartlarının bu denli uzağında olan ülkemizdeki seçim anketlerinin ve bunlardan elde edilen veriler kullanılarak yapılan çıkarım ve tahminlerin geçerli ve güvenilir olduğunu söylemek pek mümkün değildir”.
Yazarlar bulgularının sonucunu olanca nezaketleriyle ve bilimsel şüphecilik diliyle ifade etmişler, ancak makaledeki detaylar CNN’in kriterleri söz konusu olduğunda anketlerin tamamının özellikle “şeffaflık eksikliği” nedeniyle başarısız kabul edilmesi gerektiğini gösteriyor.
Türkiye’de seçim anketi faaliyeti, şeffaflıktan uzaklığı iş yapma pratiğinin bir parçası olarak benimsemiştir.
Bu açıdan bir sorun yaşamıyor olsaydık bile anket verisini kullanırken güven eşiğimizi oldukça yüksek tutmak zorunda kalırdık. Her şeyden önce seçimde oy atma bir davranıştır. İnsanların karar sürecinin sonucunda beliren eğilimlerinin davranışa dönüşmesi farklı faktörlerin etkisi altında gerçekleşir.
Bu tip anketler ise ne yazık ki “eğilimleri” ölçer. Bilindiği gibi “eğilim – karar – davranış” arasında bu anketlerle gözlemlenmesi pek mümkün olmayan ve başlangıçta oluşan eğilimi değiştirebilecek ölçüde önemli etkenler vardır.
Bu süreçte istatistik bilimi açısından kesin olan tek şey anakütle (popülasyon) parametrelerinin gerçek değerlerini kesin olarak asla tahmin edemeyeceğimizdir. Ne kadar hassas yöntemler ve yaklaşımlar uygulayacak olursak olalım tahminlerin tamamı mutlaka bir hata barındırır. Aslında istatistik bilimi bir açıdan yapılacağı kesin olan bu hatanın bilim ve tecrübe ile yönetilmesine odaklanır.
Hatanın üç temel kaynağı vardır. Birincisi, örneklem seçimi. Anket firmaları, örneğin TÜİK’in sahip olduğu örneklem çerçevesine sahip olmadıklarından yüksek hassasiyet taşıyan örneklem oluşturmakta zorlanırlar. Uzun zamandır düzenli (örneğin aylık) ve sosyolojik temelleri takip etmeyi amaçlayan anketler yapan firmaların bu açığı bir ölçüde kapatmaları mümkündür ancak oldukça güçtür.
Hatanın ikinci kaynağı, anket tasarımı ve veri toplama yöntemidir. Bu konuda sevgili Emre Erdoğan’ın Medyascope’ta yayımlanan yazısına referans vererek geçiyorum. Emre’nin yazısından da anlaşılabileceği gibi, bu konuda güvenilir anket şirketi bulmak çok zor.
Hatanın üçüncü kaynağı ise istatistiksel tahmin aşamasıdır. Genelde piyasada gördüğümüz anketlerin büyük çoğunluğu oy oranı gibi kimi hedef değişkenleri ve bazı demografik özelliklere göre ayrıştırılmış (dekompoze edilmiş) parçalarına ait oranları tahmin etmeye çalışırlar. Oysa bir toplumsal ağ içerisinde bireylerin çeşitli sosyolojik ve psikolojik faktörlere bağlı olarak davranışlarını tahmin etmekten bahsediyoruz. Bu parametreler çeşitli kontrol değişkenlerinin etkisini de içeren katmanlı modeller kullanılarak tahmin edilmezlerse yapılacağı kesin olan hatayı büyütme tehlikesi ile karşı karşıyayız demektir.
Bu sorun anketin dibine “bu anketin hata payı %2.5’tir” gibi genelgeçer ve nasıl hesaplandığı tam olarak belli olmayan, daha doğrusu genel amaçlı formüller kullanılarak bulunmuş sayıları yazarak çözülemez.
Ayrıca içinde bulunduğumuz tedirginlik ortamında cevapların yansızlığı, bölünmüş ve kemikleşmiş davranış kalıpları nedeniyle davranışı etkileyen sosyoekonomik faktörlerle davranışlar arasındaki parametrelerin etkinliklerini yitirmiş olmaları, karar ile davranış arasındaki bağın ve açıklığın tahmin edilmesindeki güçlükler gibi çok sayıda faktör, anketlerden elde edilen tahminlerin etkinliğini azaltır.
Bir an için milletvekilliği eşik değerinin %2,5 olduğu bir seçim çevresi düşünelim. Anket sonuçları oy verme eğilimlerine göre partinin oy oranının alt ve üst limitlerini eşik değerin üzerinde gösteriyorsa (örneğin %2,5 ile %5 arası gibi) %97,5 ihtimalle eşik değerin üzerinde oy alınabileceğinden bahsedebiliriz. Eğer eşik değer tahmin aralığının içerisinde kalıyorsa (örneğin %2 ile %4 arası gibi) eşik değerinin aşılıp aşılamayacağına dair bir ihtimal hesaplamak mümkün değildir. Oy oranının %2 olması da, %4 olması da istatistikî olarak güvenilir tahmin sınırı içinde kalır. Bu durumda tahmin değeri eşik değere ulaşılıp ulaşılamayacağı açısından güvenilir bir karar destek verisi olma niteliğini kaybeder. Eşik değer açısından yol gösterici olamaz. Nokta tahmini veren anketlerin verilerinden yola çıkarak karar almak bu açılardan oldukça risklidir.
Öte yandan örneğin İstanbul’un herhangi bir seçim çevresinde takriben 4 milyon civarında seçmen olduğunu düşünebiliriz. Bu seçim çevresinde 2 bin deneklik bir örneklem üzerinden anket yapılsa buradaki her bir gözlem biriminin ortalama ağırlığı 2 bin civarında olacaktır. Yani bir denek ortalama 2 bin kişiyi temsil edecektir. %3’lük bir oy oranın hesaplanması için yaklaşık 60 kişinin (2000*0.03=60) tercih bildirmesi yeterli olacaktır.
Seçime katılım %85 düzeyinde gerçekleşecek olursa 3,4 milyon oy kullanılacak demektir. Burada %3 102 bin oy anlamına gelir. Bu durumda, 102 bin kişinin altmış tanesinin 2 bin kişilik örneklem içerisine doğru tahmin verecek şekilde yansımasının mümkün olup olmayacağı önemli bir sorudur.
Eğer elli kişi yansırsa ortalama 20 bin oy az, yetmiş kişi denk düşerse de aynı miktarda oy fazladan tahmin edilecektir. Her birinde yaklaşık %20’lik bir sapma gerçekleşmiş olur. Bu arada söz konusu sapmadan ötürü bir bütün olarak anketin güvenilirliği istatistiksel açıdan pek değişmez.
Bu yazı Birikim Dergisi’nden kısaltılarak aktarıldı. Tamamına buradan ulaşabilirsiniz.