Ana Sayfa Arama Yazarlar
Üyelik
Üye Girişi
Yayın/Gazete
Yayınlar
Kategoriler
Servisler
Nöbetçi Eczaneler Sayfası Nöbetçi Eczaneler Hava Durumu Namaz Vakitleri Gazeteler Puan Durumu
WhatsApp
Sosyal Medya
Uygulamamızı İndir

Yapay Zekanın Gizli Öğretmeni: Reddit Verileriyle Yüzde 40 Öğrenme

ChatGPT, Gemini ve Llama Gibi Büyük Dil Modelleri, Resmi Kaynaklar Yerine En Çok Reddit Tartışmalarına Güveniyor

ChatGPT, Gemini ve Llama Gibi Büyük Dil Modelleri, Resmi Kaynaklar

Yapay zeka (YZ) teknolojisindeki devrim, ChatGPT, Gemini, Llama ve Grok gibi Büyük Dil Modelleri (LLM) ile günlük hayatın merkezine yerleşti. Ancak bu gelişmiş modellerin sorgulamalara cevap verirken hangi kaynakları kullandığı sorusu, uzun süredir teknoloji dünyasının gündemindeydi. Yapılan araştırmalar, YZ’nin “en çok alıntı yaptığı” kaynağın, şaşırtıcı bir şekilde, sosyal medya platformu Reddit olduğunu ortaya koydu.

 

Reddit Zirvede: Gerçek Kişi Tartışmaları Önem Kazanıyor

Online istatistik portalı Statista tarafından derlenen verilere göre, yılın ilk çeyreğinde büyük dil modelleri tarafından en çok alıntılanan web siteleri listesinin zirvesinde büyük bir farkla reddit.com yer aldı:

  • Reddit (reddit.com): %40,11
  • Wikipedia: %26,3
  • YouTube: %23,5
  • Google: %23,2

Uzmanlar, yapay zekanın resmi ve düzenlenmiş makaleler yerine, kullanıcıların doğal dil ve gerçek tartışmalarının yer aldığı Reddit platformunu bu kadar yüksek oranda kullanmasının kritik bir gösterge olduğunu belirtiyor. Bu durum, LLM’leri geliştiren şirketlerin, yapay zekanın insan konuşmasına yakın, doğal ve çeşitli cevaplar üretmesini öncelediğini gösteriyor.

 

Resmi Kaynaklar Geride Kaldı

Araştırmada dikkat çeken bir diğer nokta ise, düzenlenmiş makaleleri kullanan Wikipedia‘nın, herhangi bir düzenleme süzgecinden geçmeyen Reddit verilerine göre önemli ölçüde geride kalmasıdır. Bu durum, LLM’lerin sadece bilgi doğruluğuna değil, aynı zamanda dilin bağlamı ve doğal akışına da odaklandığını kanıtlıyor.

Listenin devamında yer alan popüler kaynaklar, YZ’nin kullanıcı etkileşimlerinden ve incelemelerden beslendiğini gösteriyor:

  • Yelp.com: %21
  • Facebook: %19,9
  • Amazon: %18,7

 

Veri Savaşı: Google ve OpenAI’dan Milyonluk Anlaşmalar

Yapay zeka modellerinin eğitilmesi için gereken devasa veri setleri, teknoloji devlerini harekete geçirdi. Google ve Reddit arasında 2024 yılında imzalanan anlaşmayla Google’ın yapay zekalarının Reddit verileriyle beslenmesi resmiyet kazandı. Reuters haberine göre bu anlaşma, Google’ın Reddit’e yıllık 60 milyon dolar ödeme yapmasını içeriyor.

Aynı şekilde, Reddit‘in OpenAI (ChatGPT’nin yaratıcısı) şirketiyle de bir veri paylaşımı anlaşması yaptığı bildirildi. Bu ticari anlaşmalar, bugün YZ’nin verdiği cevaplardaki Reddit etkisini pekiştirirken, kaliteli eğitim verisinin küresel teknoloji rekabetindeki kritik değerini ortaya koyuyor.