DeepSeek V4 hat seine produktionsreife elastische Computing-Sandbox, DSec, vorgestellt, die darauf ausgelegt ist, die Prozesse nach dem Training und die Evaluierung von Agenten zu verbessern. Die DSec-Infrastruktur unterstützt das Reinforcement Learning großer Modelle, indem sie eine umfangreiche Umgebung für Code-Experimente bereitstellt. Ein einzelner DSec-Cluster kann Hunderttausende gleichzeitiger Sandboxes verwalten und überwindet Leistungsprobleme beim Kaltstart durch hierarchisches On-Demand-Laden. DSec ist in Rust entwickelt und in das verteilte Dateisystem 3FS integriert und bietet ein einheitliches Python-SDK für nahtloses Umschalten zwischen verschiedenen Ausführungs-Backends. Um die Entwicklererfahrung zu verbessern, integriert DSec Funktionsaufrufe, Container, Mikro-Virtualmaschinen und vollständige Virtualmaschinen in einem System, wobei für den Wechsel der Backends nur eine Parameteränderung erforderlich ist. Darüber hinaus adressiert DSec Herausforderungen bei der Aufgabenunterbrechung in Rechenclustern mit einem globalen Trajektorienprotokoll, das eine schnelle Wiederherstellung von Checkpoints ermöglicht und Fehler durch redundante Ausführung vermeidet, indem zwischengespeicherte Befehlsresultate erneut abgespielt werden.