DeepSeek đã giới thiệu một mô hình AI mới mang tên 'MODEL1' vào dịp kỷ niệm một năm ngày ra mắt người tiền nhiệm của nó, DeepSeek-R1. Thông báo này được đưa ra sau khi cập nhật mã FlashMLA trên GitHub, nơi 'MODEL1' được nhắc đến 28 lần trong 114 tệp, cho thấy sự khác biệt của nó so với mô hình V32 hiện có, được biết đến với tên DeepSeek-V3.2. Mô hình mới có những tiến bộ đáng kể, bao gồm thay đổi trong bố cục bộ nhớ đệm khóa-giá trị, cải thiện xử lý độ thưa, và giải mã FP8, cùng với nhiều kỹ thuật tối ưu hóa bộ nhớ khác.