OpenAI의 GPT 이미지 2.0은 연구 과학자 첸 보위안(Chen Boyuan)이 이끌며 이미지 내에서 중국어 텍스트를 렌더링하는 데 있어 큰 진전을 이루었습니다. 지난주에 출시된 이 모델은 중국어 문자를 정확하게 생성하고, 레이아웃을 처리하며, 논리적으로 구성된 인포그래픽을 만드는 능력으로 찬사를 받았습니다. 이는 이전 모델들이 텍스트 렌더링에 어려움을 겪어 종종 알아볼 수 없는 낙서 같은 결과물을 내던 것과는 다른 발전입니다. 모델 개발에 중요한 역할을 한 첸 보위안은 Zhihu에서 이 모델의 향상된 기능에 대해 통찰을 공유했습니다. 그는 생성 모델을 시각적 이해 및 의사 결정 시스템과 통합하는 것의 중요성을 강조하며, 이미지와 언어를 포괄적으로 이해하는 것을 목표로 한다고 밝혔습니다. 만화나 시각적 증명과 같은 복잡한 시각 구조를 생성하는 모델의 능력은 고급 텍스트 제어 및 공간 추론 능력을 보여주며, AI 생성 이미지의 새로운 기준을 세웠습니다.