El equipo Multi-X de OPPO ha presentado X-OmniClaw, un marco de agentes de IA para Android de código abierto diseñado para operar principalmente en dispositivos locales. Este marco "edge-first" realiza los procesos centrales de control, percepción y ejecución en el propio dispositivo, utilizando modelos basados en la nube solo para tareas de razonamiento complejas. X-OmniClaw tiene como objetivo transformar los smartphones en asistentes de IA continuos, integrando entradas de cámara, pantalla y voz para realizar acciones dentro de aplicaciones reales. La arquitectura del marco consta de tres componentes: percepción, ejecución y memoria. La capa de percepción utiliza un modelo de visión y lenguaje para entender las escenas, mientras que la capa de ejecución identifica interfaces para la navegación y la interacción. La capa de memoria retiene información contextual a lo largo de las tareas. X-OmniClaw también cuenta con clonación de comportamiento, que permite al sistema replicar rutas demostradas por el usuario usando deeplink de Android, y enfatiza la memoria semántica a largo plazo para mejorar la continuidad de las tareas. El proyecto, basado en la base de código HermesApp, está disponible en GitHub, y OPPO planea futuras actualizaciones.