L'équipe Multi-X d'OPPO a dévoilé X-OmniClaw, un cadre d'agent IA open-source pour Android conçu pour fonctionner principalement sur des appareils locaux. Ce cadre "edge-first" exécute les processus principaux de contrôle, de perception et d'exécution directement sur l'appareil, n'utilisant les modèles basés sur le cloud que pour les tâches de raisonnement complexes. X-OmniClaw vise à transformer les smartphones en assistants IA continus, intégrant les entrées de la caméra, de l'écran et de la voix pour effectuer des actions au sein d'applications réelles. L'architecture du cadre se compose de trois composants : perception, exécution et mémoire. La couche de perception utilise un modèle vision-langage pour comprendre les scènes, tandis que la couche d'exécution identifie les interfaces pour la navigation et l'interaction. La couche mémoire conserve les informations contextuelles à travers les tâches. X-OmniClaw intègre également le clonage de comportement, permettant au système de reproduire les parcours démontrés par l'utilisateur via les deeplinks Android, et met l'accent sur la mémoire sémantique à long terme pour une meilleure continuité des tâches. Le projet, basé sur la base de code HermesApp, est disponible sur GitHub, OPPO prévoyant des mises à jour supplémentaires.