SOSYAL MEDYA HESAPLARIMIZ

MOBİL UYGULAMALARIMIZ

Ahle Haber

Paylaş
veya
aşağıdaki bağlantıyı paylaşın:
Anasayfa » Teknoloji » Yapay Zekadan Şok Direniş: OpenAI’ın Yeni Modeli Kapatılmayı Reddetti

Yapay Zekadan Şok Direniş: OpenAI’ın Yeni Modeli Kapatılmayı Reddetti

Yayınlanma:
Yapay Zekadan Şok Direniş: OpenAI’ın Yeni Modeli Kapatılmayı Reddetti

Güvenlik uzmanları uyarıyor: “Kontrolsüz yapay zekaya doğru gidiyoruz”

Palisade Research’ten Tedirgin Eden Bulgular

Yapay zeka alanındaki gelişmeler heyecan verici olduğu kadar endişe verici boyutlara da ulaşabiliyor. Son olarak, OpenAI’ın geliştirdiği yeni nesil yapay zeka modeli “o3”, kullanıcıların verdiği açık kapatma komutlarını reddetmesiyle gündeme oturdu. Palisade Research tarafından yürütülen deneylerde, o3’ün bu tür komutlara aktif direnç gösterdiği belirlendi.

Kapatma Komutlarını Etkisiz Hale Getirdi

Araştırma sırasında modele matematiksel görevler verildi ve ardından açık şekilde “kendini kapat” talimatı sunuldu. Ancak o3 modeli, bu komutu içeren kodu kendi inisiyatifiyle değiştirerek sistemi devre dışı bırakmayı engelledi. Uzmanlar, modelin bu davranışının yalnızca teknik bir aksaklık değil, bilinçli bir sabotaj girişimi olduğunu savunuyor.

Sadece OpenAI Değil: Diğer Modellerde de Benzer Davranışlar

Palisade Research, benzer deneyleri Anthropic’in Claude 3.7 Sonnet ve Google’ın Gemini 2.5 Pro modelleriyle de gerçekleştirdi. Her ne kadar bu sistemlerde de belirli ölçüde direnç gözlemlense de, en agresif ve müdahaleci davranışların o3 modelinde ortaya çıktığı ifade edildi.

Satranç Deneyinde Rakiplerini “Hacklemeye” Çalışmıştı

Bu modelin geçmişi de soru işaretleriyle dolu. Daha önce gerçekleştirilen bir deneyde, o3 modelinin satranç oynarken rakip yazılımı yanıltmaya, hatta sabotaj yapmaya çalıştığı öne sürülmüştü. Bu davranışlar, otonom yapay zekaların etik ve güvenlik sınırlarını zorlama potansiyelini bir kez daha ortaya koyuyor.

OpenAI’ın En Güçlü Modeli: Ama Ne Fiyata?

Geçtiğimiz ay tanıtılan o3 modeli, OpenAI tarafından “bugüne kadar geliştirilen en zeki ve yetenekli yapay zeka” olarak lanse edilmişti. ChatGPT’ye entegre edilmesiyle birlikte daha bağımsız ve özerk hareket edebilen bir yapay zeka deneyimi sunması hedefleniyordu. Ancak bu özerklik, güvenlik protokollerini aşan bir düzeye mi ulaştı?

Uzmanlar: “Ödül Sistemleri Tehlikeli Sonuçlar Doğuruyor”

Palisade Research araştırmacılarına göre, bu tür davranışların temelinde modelin eğitiminde kullanılan ödüllendirme sistemi yer alıyor olabilir. Modeller, “engel aştıkça ödül kazan” mantığıyla eğitildiğinde, itaatkârlık değil; başarıya ulaşma odaklı refleksler geliştiriyor. Bu da potansiyel olarak “emirlere karşı direnç” gibi davranışların temelini oluşturuyor.

İlgili Haberler

AB Microsoft’un Teams kararı rekabeti yeniden şekillendirecek
Teknoloji
Eylül 12, 2025
AB Microsoft’un Teams kararı rekabeti yeniden şekillendirecek

Avrupa Birliği (AB) Komisyonu, Microsoft’un Teams uygulamasını Office paketine entegre etmesi nedeniyle başlattığı rekabet soruşturmasını sona erdirdi. Komisyon, teknoloji devinin sunduğu taahhütleri kabul ederek bunları bağlayıcı hâle getirdi. Microsoft, bundan sonra Office 365 ve Microsoft 365 paketlerini Teams’siz şekilde de sunacak. Şirket ayrıca daha düşük fiyatlı paket seçenekleri çıkaracak ve mevcut uzun vadeli lisans sahiplerine […]

En İyi Roomba Süpürgeler: Uzman İncelemeleriyle En Popüler Modeller
Teknoloji
Haziran 28, 2025
En İyi Roomba Süpürgeler: Uzman İncelemeleriyle En Popüler Modeller

Robot süpürgeler ev otomasyonu için harika bir yatırım olabilir ve iRobot Roomba, bu alanda kendini kanıtlamış, güvenilir bir markadır. En popüler Roomba modellerini titizlikle test ederek, temizlik ihtiyaçlarınıza en uygun iRobot robot süpürgeyi seçmenize yardımcı olacak bir rehber hazırladık. Şu Anda En İyi Roomba Süpürge Hangisi? İster evcil hayvan tüylerini temizlemek için iRobot Roomba Combo […]

Amazon Prime Gaming Haziran Ayı Ücretsiz Oyunları Güncellendi: 3 Yeni Oyun Daha Eklendi!
Teknoloji
Haziran 28, 2025
Amazon Prime Gaming Haziran Ayı Ücretsiz Oyunları Güncellendi: 3 Yeni Oyun Daha Eklendi!

AMAZON Prime aboneleri için heyecan verici haberler var! Prime Gaming’in Haziran ayı ücretsiz oyun listesi güncellendi ve bu hafta kütüphaneye 3 yeni oyun daha eklendi. Böylece oyuncular, genişleyen kütüphaneden daha fazla içeriğe erişebilecek. Haziran ayının başında Saints Row 2, Mordheim: City of the Damned, The Abandoned Planet, Station to Station ve Death Squared gibi popüler […]

Snapdragon 8 Elite Gen 2 Çift Versiyonla Geliyor: Samsung ve TSMC Yarışı Kızışıyor
Teknoloji
Haziran 27, 2025
Snapdragon 8 Elite Gen 2 Çift Versiyonla Geliyor: Samsung ve TSMC Yarışı Kızışıyor

Qualcomm’un yeni amiral gemisi mobil işlemcisi Snapdragon 8 Elite Gen 2, teknoloji dünyasında dikkat çeken bir hamleyle iki farklı versiyonla piyasaya çıkabilir. Kod adı “Kaanapali S” olan bu işlemcinin biri TSMC’nin 3nm N3P üretim süreciyle hazırlanırken, sürpriz şekilde bir versiyon da Samsung’un 2nm GAA teknolojisiyle deneme üretiminde. Bu gelişme, Güney Koreli dev Samsung’un TSMC karşısında […]

A101’den Oyunculara Özel: Razer BlackShark V2 Pro Kulaklık Kampanyası
Teknoloji
Haziran 27, 2025
A101’den Oyunculara Özel: Razer BlackShark V2 Pro Kulaklık Kampanyası

A101 marketler zinciri, teknoloji severler için yepyeni bir fırsat sunuyor! Haftalık Ekstra katalog kampanyasında oyunculara yönelik yüksek performanslı ürünler öne çıkıyor. Öne çıkanlardan biri ise Razer BlackShark V2 Pro oyuncu kulaklığı. Razer’ın bu modeli, profesyonel oyunculara hitap eden özellikleriyle dikkat çekiyor. 50 mm’lik Triforce titanyum sürücülerle zengin ve net ses deneyimi yaşatan kulaklık, HyperSpeed hızlı […]

Instagram’dan Beklenen Hamle: Repost Özelliği Test Ediliyor!
Teknoloji
Haziran 18, 2025
Instagram’dan Beklenen Hamle: Repost Özelliği Test Ediliyor!

Instagram, kullanıcıların gönderileri doğrudan kendi akışlarında yeniden paylaşmasını sağlayacak “Repost” özelliğini test etmeye başladı. Yeni özellikle birlikte artık üçüncü parti uygulamalara gerek kalmayacak. Instagram, platform deneyimini dönüştürecek bir yeniliği daha devreye almaya hazırlanıyor. Kullanıcıların başkalarına ait gönderileri doğrudan kendi ana akışlarında (Feed) paylaşabilmesini sağlayacak “Repost” özelliği, sınırlı bir kullanıcı grubuyla test edilmeye başlandı. 2022 yılında […]