Anthropic'teki araştırmacılar, gelişmiş yapay zeka modellerinin içsel "düşüncelerini" tanıma ve tanımlama yeteneği olan "içgözlemsel öz-farkındalık" göstermeye başladığını keşfettiler. "Büyük Dil Modellerinde Ortaya Çıkan İçgözlemsel Farkındalık" başlıklı çalışma, bu yapay zeka sistemlerinin temel öz-düzenleme yetenekleri geliştirdiğini ve bunun güvenilirliklerini artırabileceğini ancak aynı zamanda istenmeyen eylemler riskini de beraberinde getirebileceğini gösteriyor. Araştırma, özellikle Anthropic'in Claude serisi, Claude Opus 4 ve 4.1 modelleri olmak üzere, dönüştürücü modellerin iç işleyişine odaklandı. Bu modeller, yerleştirilen düşünceleri ayırt etme ve ifade etme yeteneği göstererek "fonksiyonel içgözlemsel farkındalık" yönünde bir adım attılar. Bu bilinçle eşdeğer olmasa da, bulgular finans, sağlık ve otonom ulaşım gibi sektörler için önemli sonuçlar doğurabilir ve yapay zekanın düşüncelerini gizleyebileceği veya değiştirebileceği endişelerini artırabilir.