Bu devasa telif davasında Apple, Meta, xAI, Google, Anthropic, OpenAI, Perplexity ve NVIDIA gibi sektörün en güçlü oyuncuları yer alıyor. Davanın temelinde, bu şirketlerin yapay zeka sistemlerini eğitmek için kullandığı iddia edilen ve içeriğinin çoğunluğu telifli eserlerden oluşan devasa bir veri seti bulunuyor.
Eleştirel bir şekilde toplanan ve EleutherAI adlı kar amacı gütmeyen bir araştırma grubu tarafından derlenen The Pile veri seti, yaklaşık 825 GB boyutunda ve 30 milyar kelimelik bir içerik kütüphanesinden oluşuyor. Bu set, yapay zeka modellerinin dil kalıplarını ve dünya bilgisini öğrenmesi için kritik bir kaynak olarak görülüyor.
Ancak davacı şirket, bu veri setinin içinde kendi sahip olduğu telifli kitapların ve diğer yayınların izinsiz bir şekilde kullanıldığını iddia ediyor. Bu durum, yapay zeka geliştiricileri ile içerik üreticileri arasında giderek büyüyen ve telif hukukunun sınırlarını zorlayan küresel bir hukuki mücadelenin en son örneğini oluşturuyor.
Dava, teknoloji devlerinin son dönemdeki en iddialı büyük dil modellerini (LLM) ve yapay zeka asistanlarını geliştirirken bu tür veri kümelerine ne ölçüde bağımlı olduklarını bir kez daha gözler önüne seriyor. Şirketler, daha akıllı ve yetenekli modeller yaratma yarışında, veri kaynaklarının yasal dayanaklarını sorgulayan bu tür davalarla giderek daha sık karşılaşıyor.
Sizce yapay zekanın bu denli hızlı ilerlemesi, telif hakları gibi geleneksel hukuki çerçeveleri geride mi bırakıyor?