OpenAI'nin araştırma bilimcisi Chen Boyuan liderliğindeki GPT Image 2.0 modeli, görüntüler içinde Çin metnini işleme konusunda önemli ilerlemeler kaydetti. Geçen hafta piyasaya sürülen model, Çin karakterlerini doğru şekilde oluşturma, düzeni yönetme ve mantıklı yapılandırılmış infografikler yaratma yeteneğiyle övgü aldı. Bu, metin işleme konusunda zorluk yaşayan ve genellikle anlaşılmaz karalamalar üreten önceki modellerden bir kopuşu temsil ediyor. Modelin geliştirilmesinde önemli rol oynayan Chen Boyuan, Zhihu'da modelin geliştirilmiş yeteneklerine dair içgörüler paylaştı. Görüntü ve dilin kapsamlı bir şekilde anlaşılması amacıyla üretken modellerin görsel anlama ve karar sistemleriyle entegrasyonunun önemini vurguladı. Modelin çizgi romanlar ve görsel kanıtlar gibi karmaşık görsel yapılar oluşturabilme yeteneği, gelişmiş metin kontrolü ve mekansal akıl yürütme kabiliyetlerini sergileyerek yapay zeka tarafından oluşturulan görüntüler için yeni bir standart belirliyor.