Das Multi-X-Team von OPPO hat X-OmniClaw vorgestellt, ein Open-Source-Android-KI-Agenten-Framework, das hauptsächlich auf lokalen Geräten betrieben werden soll. Dieses "Edge-First"-Framework führt die Kernprozesse der Steuerung, Wahrnehmung und Ausführung direkt auf dem Gerät aus und nutzt Cloud-basierte Modelle nur für komplexe Denkaufgaben. X-OmniClaw zielt darauf ab, Smartphones in kontinuierliche KI-Assistenten zu verwandeln, indem es Kamera-, Bildschirm- und Spracheingaben integriert, um Aktionen innerhalb realer Apps auszuführen. Die Architektur des Frameworks besteht aus drei Komponenten: Wahrnehmung, Ausführung und Gedächtnis. Die Wahrnehmungsschicht verwendet ein Vision-Sprach-Modell, um Szenen zu verstehen, während die Ausführungsschicht Schnittstellen für Navigation und Interaktion identifiziert. Die Gedächtnisschicht speichert kontextuelle Informationen über Aufgaben hinweg. X-OmniClaw verfügt außerdem über Verhaltensklonen, das es dem System ermöglicht, vom Benutzer demonstrierte Pfade mithilfe von Android-Deeplinks zu replizieren, und legt besonderen Wert auf ein langfristiges semantisches Gedächtnis zur verbesserten Aufgaben-Kontinuität. Das Projekt, basierend auf dem HermesApp-Codebase, ist auf GitHub verfügbar, wobei OPPO weitere Updates plant.