Dr. Taner Karaman: Ülkemizde veri gazeteciliği bazı ülkelere göre geriden geliyor
Röportaj: Murat Köten
Gazetecilik, toplumda yaşanan olayları, gelişmeleri, haberleri takip edip, bunları doğru ve tarafsız bir şekilde kamuoyuna sunan meslek grubudur. Veri gazeteciliği ise verileri bilgi haline getirip kamuoyunu sunan ve kamuoyunun konu hakkında analitik bilgi sahibi olmasını sağlar. Veri gazeteciliği, geleneksel gazetecilikten farklı olarak, büyük veri setleri, istatistikler ve grafikler gibi veri kaynaklarını kullanarak haberleri derinlemesine analiz etme ve okuyuculara daha anlamlı hale getirme yöntemidir. Bu yöntem sayesinde, haberlerin içeriği daha açıklayıcı hale gelir ve okuyuculara daha iyi bir anlayış sunulur. Veri gazeteciliği, birçok farklı konuda kullanılabilir. Örneğin, seçim sonuçları, ekonomik veriler, çevresel sorunlar gibi konularda veriler analiz edilerek daha detaylı ve anlamlı haberler yapılabilir. Bu sayede okuyucular daha bilinçli bir şekilde karar alabilirler. Ancak, veri gazeteciliği yaparken verilerin doğru ve güncel olması çok önemlidir. Ayrıca, verilerin nasıl yorumlandığı ve sunulduğu da haberin doğruluğunu etkileyebilir. Bu nedenle, veri gazeteciliği yapan gazetecilerin verileri doğru bir şekilde yorumlamaları ve sunmaları gerekmektedir.
Sabah gazetesi yazarı, A Spor yorumcusu, akademisyen ve Futbol Plus YouTube kanalı içerik yöneticisi olan, Türkiye’de veri gazeteciliğinin ve spor medyasının önde gelen isimlerinden olan Dr. Taner Karaman, veri gazeteciliğinin Türkiye’deki durumunu, gidişatını ve veri gazeteciliğinin püf noktalarını aktardı. İşte veri gazeteciliğinin tüm detaylarını konuştuğumuz röportaj.
Veri gazeteciliği nedir?
Verinin bilgiye dönüştürülerek insanlara ulaştırılmasıdır. Yani bu nedir? Ham veriyi alıyorsunuz, çeşitli analizlerden geçirerek bilgiye dönüştürüyorsunuz ve bunu insanlarla buluşturuyorsunuz. Bir nevi veri madenciliği yapıyorsunuz, tabii bunu yaparken de bazı analiz tekniklerini kullanmanız gerekiyor. Buna ek olarak da bazen ham veriyi kullanarak da haberler gerçekleştirebiliyorsunuz. Meselâ geçmiş yıllarda oluşmuş bazı dataları alarak, bunları karşılaştırarak, grafikler kullanarak bunları yayımlıyorsunuz. Veri gazeteciliği istatistiksel yöntemler kullanılarak veya kullanılmayarak bireye matematiksel değerlerle bilgiyi ve veriyi aktarma sürecidir diyebiliriz.
Ülkemizde veri gazeteciliğinin dünyanın geri kalanıyla kıyasladığınızda ne seviyede olduğunu düşünüyorsunuz?
Ülkemizde veri gazeteciliği diğer ülkelere göre biraz geriden geliyor çünkü bunun en büyük sebebi iletişim fakültelerimizde veri gazeteciliği kavramının çok geç oturmuş olması, hatta oturmamış olması. Bunun en büyük sebeplerinden biri bu. Çünkü iletişim fakültelerimizin matematik müfredatları çok zayıf olduğu için ve buradan çıkan gençlerin matematik seviyeleri çok yeterli olmadığı için, istatistiksel modelleme yapamadıkları için, grafik okuyamadıkları için, uluslararası bilgiyi takip edebilecekleri İngilizce yeterlilikleri yine bu fakültelerde yeterince verilmediği için veri gazeteciliği bilen mezun bu fakültelerde çok fazla olmuyor. Doğal olarak bireyler matematik bilmeyen, İngilizceye hakim olmayan, grafik okuyamayan, halbuki günümüz medyasında bunları yapmak zorundasınız ve veri gazetecisi olmak istiyorsanız mutlak surette sayısal detaylara çok hakim olmanız lazım. Bizim geleneksel medyamız buna çok hazırlıklı değildi ve bu anlamla bazı ülkelerin gerisinde kaldı. İspanya gibi çeşitli ülkeler bizden çok öndeler veri gazeteciliği konusunda. Bu konuda bölümler açtılar ve eğitimler veriyorlar ama bizde ne yazık ki bu konuda yeterli olmadığını söyleyebiliriz. Gelişmek için en temek nokta mutlaka müfredat güncellemesi yapılmasıdır. Ve hatta analiz programları, SPSS gibi, PYTHON gibi programlarının çocuklara öğretilmesi lazım. Öğrenmediklerinde bu çocuklar grafik okuyamazlar, analiz yapamazlar ve yapamadıkları zaman öğrenme şansları yok. Ayrıca iletişim fakülteleri sayısal yeterlilik gerektiren fakültelerdir. Sayısal yeterliliği yeterli düzeyde olmayan bireylerle veri gazeteciliğinin gelişme imkânı yoktur.
Veri gazeteciliği ile ilgili bir hikâye paylaşabilir misiniz? Nasıl veri toplandı, nasıl analiz edildi ve sonuçları nasıl yayımlandı? Daha önce yaptığınız bir çalışmadan örnek verebilirsiniz.
Veri gazeteciliği ile alakalı şöyle bir örnek verebilirim, örneğin bir futbol takımındaki sezon içinde yaşanmış sakatlıklarla alakalı yapılan bir çalışma veri gazeteciliğinin alanıdır ve bununla alakalı geçtiğimiz dönemlerde çok fazla çalışma yaptım. Örneğin, Galatasaray kulübü sezon içerisinde çok fazla sakatlık yaşamaya başladı, biz geçtiğimiz dönemlerde kim ne kadar sakatlanmış bunu çıkarttık ve bu sakatlıkları bağ sakatlığı, yırtık olma vakasına göre yüzdeledik ve bunu gidip Avrupa’nın majör takımlarıyla karşılaştırıp Galatasaray’ın bu alanda zirvede olduğunu gördük. Yani Galatasaray’ın bu tarz sakatlıklar konusunda Avrupa’nın en kötü takımı olduğunu ortaya koymuştuk. Ve ertesi gün bunu Sabah gazetesinde yayımladığımızda Galatasaray kulüp doktoru Yener İnce arayarak konuyu izah etme ihtiyacı duymuştu. Başka bir örnek daha verebilirim. Beşiktaş’ta çalım meraklısı olan bir kaleci vardı, İspanyol kaleci Fabri. Ve bu kaleci bir gün çalım atmaya çalışırken çok kritik bir maçta kalesinde gol gördü. Biz de çıkarttık geçtiğimiz yıllardaki kalesinde çalım atmaya çalışırken yediği golleri ve çalım denemelerini listeledik ve bunu bir tablo yaptık. Meselâ bu da bir veri gazeteciliğidir. Geçmiş dataları bugüne işlemiş olduk. Ve ‘Bu sefer sıçrayamadı!’ başlığıyla Sabah gazetesinde bunun haberini yapmıştık ve o dönem çok da ses getirmişti. Hatta Hıncal Uluç köşesinde bu haberden bahsetmişti. Aslında çok fazla haberim var, ismimle birlikte aratırsanız binin üzerinde haber görebilirsiniz.
Veri gazeteciliği ne kadar yaygın bir uygulama? Gelecekte gazeteciliği nasıl etkileyeceğini düşünüyorsunuz?
Yapay zekânın, veri madenciliğinin bu kadar ilerlediği bir toplumda veri gazeteciliği de ilerlemek zorunda. Türkiye’nin dijital medyası, Türkiye’nin iletişim fakülteleri de buna adapte olmak zorunda. Eğer adapte olamazsa işte o zaman problem başlar. Biz şu anda bunun başındayız. Hızlı bir şekilde atlatırsak o zaman veri gazeteciliğinde de bir yerlere gelebiliriz.
Veri gazeteciliği için en önemli beceriler nelerdir? Bir kişinin veri gazetecisi olabilmesi için ne önerirsiniz?
Veri gazeteciliği için en olmaz nokta, birincisi obsesif olması lazım. Yani bu ne demek, takıntılı, bakacak, inceleyecek, sıkılgan olmayacak, meraklı olacak, analitik incelemeyi bilecek, ipuçlarını toplamayı bilecek, nerede ne data var onu bulmayı bilecek. Örnek vermek gerekirse, bir spor datası hangi sitede var sağlıklı olarak onu bulmayı bilecek ve bunları bir excel’de topladıktan sonra analiz edebilecek yani veri madencisi ya da veri gazetecisi olmak için meraklı olmak lazım ve sayısal detaylara hâkim olmak gerekmektedir. Bunlar olmadıktan sonra veri gazetecisi olmak mümkün değil.
Veri gazeteciliği ile ilgili en zorlu konular nelerdir? Veri güvenilirliği ve özellikle veri gizliliği gibi konular hakkında ne düşünüyorsunuz?
Bu alanda en zorlu konu veriye ulaşmak tabii ki. Özellikle ne yazık ki futbol kulüplerimiz çok şeffaf olmadığı için dataya ulaşmakta zorluk çekebiliyorsunuz. Ama son dönmelerde çok farklı platformlar ortaya çıktı ve bu platformların oluşturduğu dataları bir araya getirebiliyorsunuz. Kişisel Verileri Koruma Kanunu ile alakalı temelde problem yaşamıyorsunuz eğer ki bireyler üstünden çalışmıyorsanız ve sağlık datası üstünden çalışmıyorsanız. Eğer sağlık datası ile çalışırsanız işin içine bir de CDPR giriyor ama şahıslar üzerinden gitmediği için ve kulüplerin açıkladığı resmi rakamlar üstünden gittiği için sağlık dataları çok problem teşkil etmiyor. Ama Kişisel Verileri Koruma Kanunu, kişisel verileri kullanmadığınız için sıkıntı oluşturmuyor. Biz genelde zaten takım dataları kullanıyoruz. Aynı zamanda, kişilerin verilerini bir araya getirip işleyip ortaya bir veri çıkarttığınız için Kişisel Verileri Koruma Kanunu ile problem yaşama ihtimaliniz azalmış oluyor.
Veri gazeteciliği yapan bir kişi olarak, ne tür araçlar ve teknolojiler kullanıyorsunuz?
Bu alanda çalışma yaparken SPSS özellikle kullanıyorum. Bu bir istatistik programıdır, özellikle bunu kullanırım. Bu programla yapabileceğiniz birçok analiz yöntemi var. En temel aracım budur ama MatLab, Python gibi çeşitli platformları da tavsiye ederim, bunlar da yine kullanılabilen şeyler. Ama ileri seviyede ihtiyaç duyulan şeyler olduğu için orta seviyede çalışanlar için SPSS yeterli olacaktır ve tabii ki Excel yeterli olacaktır. Bir de web kazıma denilen bir kavram var, bu da web sitelerinden veriyi otomatik olarak çekmenizi sağlar, bu web kazıma programlarını da kullanmak gerekiyor yoksa elinizde teker teker datayı toplamak bazen günlerinizi alabiliyor, bunu yapmışlığım var ama web kazıma yöntemleriyle bilgisayar kendi kendine o dataları toplayabilir, o yüzden web kazıma önemli.
Veri gazeteciliğiyle ilgili ilginç veya dikkat çekici bir trend veya konu var mı?
Veri gazeteciliği ile alakalı trend nokta şu aslında. Bu trend her zaman değişiyor, şu an yapay zekâ üzerinden bir trend var, ilerleyen dönemlerde sakatlıklar olabilir, finans olabilir, seçim dönemi geldiğinde seçimle alakalı olabilir yani aslında veri gazeteciliği doğal olarak güne ve gündeme göre değişen bir trende sahip, sabit bir noktası yok ama şu anda yapay zekâ olduğunu söyleyebilirim.
Veri gazeteciliğinin geleceği hakkında ne düşünüyorsunuz? Hangi yönde ilerleyeceğini ve nasıl gelişeceğini öngörüyorsunuz?
Veri gazeteciliğinin geleceği az önce de söylediğim gibi yapay zekâya doğru evriliyor gibi duruyor. Ve artık kulüpler veya bireyler veya kurumlar veri gazeteciliğinden çıkan bilgilere dikkat kesilecekler, yani şu tablo var, birey ya da izleyen ya da okuyan kişiler bilgi edinmek istiyor, yani siz bu bilgiyi ne kadar verebiliyorsunuz, şaşırmak istiyorlar, şaşırtılmak istiyorlar. Siz onları şaşırtmak istiyorsanız veriyi bilgiye dönüştürüp onlara bilmedikleri bir şeyi sunmanız lazım ve veri gazeteciliğinin sanırım en güzel noktalarından bir tanesi de, siz kendi özel içeriğinizi çıkartabiliyorsunuz yani her gazetede olan veya her televizyonda olan içeriği değil, kendi analizinizi ortaya çıkarttığınız için bu da insanları çeken nokta oluyor.
Veri gazeteciliği konusunda çalışırken veri güvenilirliği ve doğruluğunu nasıl sağlıyorsunuz? Özellikle açık kaynaklı verilerle çalışırken, verilerin doğruluğunu nasıl kontrol ediyorsunuz?
Verilerin doğruluğunu karşılaştırma ile yapıyorsunuz, yani bir takımın pas sayısı 5 farklı platformda varsa, 5 farklı platform üzerinden bakıyorsunuz ve içlerinde absürt bir farklılık varsa yani bunu biz sapma olarak da söyleyebiliriz, birbirine paralel gitmeyen bir data varsa onu dikkate almıyoruz. Ama 4 platform 400-450 arasında pas sayısı gösterirken diğer bir platform 600 pas sayısı gösteriyorsa 600 pas olanı çöpe atıyoruz. O yüzden de karşılaştırma yöntemi ile farklı platformlarla eşleştirme yöntemiyle veri güvenliğini sağlıyoruz.