Postingan

Menampilkan postingan dengan label Etika Digital

Ketika Kecerdasan Buatan 'Menghafal' Karya Berhak Cipta: Studi Terbaru Soroti Praktik OpenAI

Gambar
Kemajuan pesat teknologi kecerdasan buatan (AI) seperti ChatGPT dari OpenAI dihadapkan pada sorotan baru: tuduhan bahwa model-model ini "menghafal" konten berhak cipta secara ilegal. Dua studi independen yang dirilis pekan ini mengungkap bukti bahwa GPT-4, GPT-3.5, dan GPT-4o dilatih dengan materi berhak cipta seperti buku, artikel berbayar, dan kode program, memicu kembali perdebatan etis dan hukum seputar pelatihan AI. Bukti "Hafalan" Konten Berhak Cipta Metode Deteksi dengan Kata "High-Surprisal" Peneliti dari Universitas Washington, Kopenhagen, dan Stanford menemukan bahwa GPT-4 dan GPT-3.5 mampu mereproduksi kalimat utuh dari buku-buku populer (termasuk dataset BookMIA) dan artikel  The New York Times . Mereka menggunakan kata-kata "high-surprisal"—istilah statistik langka dalam konteks tertentu—untuk menguji apakah model AI bisa menebak kata yang di- masking . Hasilnya, model OpenAI berhasil menebak kata-kata tersebut dengan akurasi tinggi,...