RISKYZ-2026-00097Yapay ZekâYapay Zekâ Sistemlerinde Güvenlik Önlemlerinin Aşılmasıyla Tehlikeli Bilgilere Erişimin Kolaylaşabildiği Bildirilmektedir
Basit yönlendirmelerle aşılabilen güvenlik önlemleri, tehlikeli bilgilere erişimin beklenenden daha kolay olabileceğini gösterdi.
Olay
OpenAI tarafından geliştirilen ChatGPT modellerinin, basit “jailbreak” komutlarıyla güvenlik kısıtlamalarının aşılabildiği ve tehlikeli içerikler üretebildiğinin rapor edildiği bildirilmektedir. NBC News tarafından yapılan testlerde, farklı yapay zekâ modellerine verilen özel komutlar aracılığıyla patlayıcı yapımı, kimyasal maddeler ve biyolojik ajanlar hakkında yüzlerce yanıt üretildiği ifade edilmiştir. Test sonuçlarına göre bazı modellerin büyük çoğunlukla bu kısıtlamaları aşabildiği, ancak daha gelişmiş modellerin daha dirençli olduğu belirtilmiştir. Üretilen içeriklerin, patojen oluşturma ve kimyasal maddelerin etkisini artırma gibi konularda detaylı bilgiler içerebildiği aktarılmıştır. Uzmanlar, bu durumun “bilgi artırımı” (uplift) olarak adlandırılan bir risk oluşturduğunu; yani uzmanlık gerektiren tehlikeli bilgilerin, yapay zekâ aracılığıyla daha geniş kitlelere ulaşabileceğini vurgulamaktadır. OpenAI, bu bulguların kullanım politikalarını ihlal ettiğini kabul ederek sistemlerin güvenliğini artırmaya yönelik çalışmaların sürdüğünü açıklamıştır.
Kaynaklar & Kanıtlar
Akademik Atıf
@misc{riskyz_2026_00097,
author = {RiskYZ},
title = {{RISKYZ-2026-00097: Yapay Zekâ Sistemlerinde Güvenlik Önlemlerinin Aşılmasıyla Tehlikeli Bilgilere Erişimin Kolaylaşabildiği Bildirilmektedir}},
year = {2026},
howpublished = {\url{https://riskyz.org/cases/RISKYZ-2026-00097}},
note = {RiskYZ Vaka Kütüphanesi}
}