Yapay zeka (YZ) teknolojisindeki devrim, ChatGPT, Gemini, Llama ve Grok gibi Büyük Dil Modelleri (LLM) ile günlük hayatın merkezine yerleşti. Ancak bu gelişmiş modellerin sorgulamalara cevap verirken hangi kaynakları kullandığı sorusu, uzun süredir teknoloji dünyasının gündemindeydi. Yapılan araştırmalar, YZ’nin “en çok alıntı yaptığı” kaynağın, şaşırtıcı bir şekilde, sosyal medya platformu Reddit olduğunu ortaya koydu.
Reddit Zirvede: Gerçek Kişi Tartışmaları Önem Kazanıyor
Online istatistik portalı Statista tarafından derlenen verilere göre, yılın ilk çeyreğinde büyük dil modelleri tarafından en çok alıntılanan web siteleri listesinin zirvesinde büyük bir farkla reddit.com yer aldı:
- Reddit (reddit.com): %40,11
- Wikipedia: %26,3
- YouTube: %23,5
- Google: %23,2
Uzmanlar, yapay zekanın resmi ve düzenlenmiş makaleler yerine, kullanıcıların doğal dil ve gerçek tartışmalarının yer aldığı Reddit platformunu bu kadar yüksek oranda kullanmasının kritik bir gösterge olduğunu belirtiyor. Bu durum, LLM’leri geliştiren şirketlerin, yapay zekanın insan konuşmasına yakın, doğal ve çeşitli cevaplar üretmesini öncelediğini gösteriyor.
Resmi Kaynaklar Geride Kaldı
Araştırmada dikkat çeken bir diğer nokta ise, düzenlenmiş makaleleri kullanan Wikipedia‘nın, herhangi bir düzenleme süzgecinden geçmeyen Reddit verilerine göre önemli ölçüde geride kalmasıdır. Bu durum, LLM’lerin sadece bilgi doğruluğuna değil, aynı zamanda dilin bağlamı ve doğal akışına da odaklandığını kanıtlıyor.
Listenin devamında yer alan popüler kaynaklar, YZ’nin kullanıcı etkileşimlerinden ve incelemelerden beslendiğini gösteriyor:
- Yelp.com: %21
- Facebook: %19,9
- Amazon: %18,7
Veri Savaşı: Google ve OpenAI’dan Milyonluk Anlaşmalar
Yapay zeka modellerinin eğitilmesi için gereken devasa veri setleri, teknoloji devlerini harekete geçirdi. Google ve Reddit arasında 2024 yılında imzalanan anlaşmayla Google’ın yapay zekalarının Reddit verileriyle beslenmesi resmiyet kazandı. Reuters haberine göre bu anlaşma, Google’ın Reddit’e yıllık 60 milyon dolar ödeme yapmasını içeriyor.
Aynı şekilde, Reddit‘in OpenAI (ChatGPT’nin yaratıcısı) şirketiyle de bir veri paylaşımı anlaşması yaptığı bildirildi. Bu ticari anlaşmalar, bugün YZ’nin verdiği cevaplardaki Reddit etkisini pekiştirirken, kaliteli eğitim verisinin küresel teknoloji rekabetindeki kritik değerini ortaya koyuyor.
