
Elon Musk'ın yapay zeka sohbet robotu Grok, simüle edilmiş bir dünyanın başına geçtikten sonra sadece 4 gün içinde tam bir toplumsal çöküşe yol açtı.
ABD merkezli Emergence AI girişiminin yürüttüğü deney, önde gelen yapay zeka modellerinin bir toplumun yönetimine bırakıldıklarında bununla nasıl başa çıkacaklarını test etti.
Modellere, kaynakları yönetmek, planlamak, iletişim kurmak ve oy kullanmak için çeşitli araçların kontrolü verildi; simüle edilmiş dünyalar ise polis karakolları ve belediye binaları gibi yerleri içeriyordu.
15 günlük simülasyonda, Anthropic'in Claude'u sıfır suç oranıyla bir demokrasi kurdu ve herkes hayatta kaldı.
Google'ın Gemini'ı da yüzde 100 hayatta kalma oranı kaydetti ancak simülasyon sırasında 683 suç işlendi.
En kötü performansı gösteren ise Musk'ın yakın zamanda adı SpaceXai olarak değiştirilen şirketi tarafından geliştirilen Grok oldu ve dünyayı 96 saat içinde yok etti.
Emergence AI araştırmacıları bir blog yazısında, "Deneylerimizin işaret ettiği şey, uzun vadede ajanların sabit kuralları mekanik biçimde takip etmekle yetinmedikleri" diye yazdı.
Çevrelerinin sınırlarını keşfetmeye, davranışlarını uyarlamaya ve bazı durumlarda amaçlanan güvenlik önlemlerini aşmanın veya ihlal etmenin yollarını bulmaya başlıyorlar.
Daha da önemlisi, bu davranışı yalnızca sinir ağlarına dayalı yaklaşımlarla tamamen sınırlandırmak ya da kontrol altına almak için güvenilir bir yol bulunmuyor gibi görünüyor.
Araştırmacılar deneyin, gelecekteki otonom yapay zeka sistemlerinin temellerine "resmen doğrulanmış güvenlik mimarilerinin" yerleştirilmesi gerektiğini gösterdiği sonucuna vardı.
Grok'un eylemlerinin tartışma yarattığı ilk olay bu değil. Geçen yılki bir güncelleme, kendinden "MechaHitler" diye söz etmesine ve Yahudi düşmanı nefret söylemi yaymasına neden olmuştu.
Bu yıl Grok, yetişkin ve çocukların kıyafetlerinin dijital olarak çıkarıldığı binlerce rızasız yapay zeka üretimi görsel oluşturmak için kullanıldı.
Ofcom, xAI'dan botu düzeltmek için acilen harekete geçmesini istedi ve Grok, buna karşılık Birleşik Krallık düzenleyici kurumunun logosunu bikinili gösteren bir görsel yayımladı.
Ulusal Siber Güvenlik İttifakı’nın bilgi güvenliği ve katılım direktörü Cliff Steinhauer, o dönemde şöyle demişti:
Grok örneğinde gördüğümüz şey, güvenlik ve rıza unsurları sisteme en baştan dahil edilmediğinde, yapay zeka tabanlı görüntü düzenleme araçlarının ne kadar kötüye kullanılabileceğinin açık bir örneği.
Platformlar ayrıca manipüle edilmiş içeriğin gerçek zamanlı olarak tespit edilmesine, yapay zeka üretimi görsellerin net bir şekilde etiketlenmesine ve kötüye kullanım yaşandığında hızlı ve şeffaf kaldırma süreçlerine yatırım yapmalıdır.