Nhóm Multi-X của OPPO đã giới thiệu X-OmniClaw, một khung tác nhân AI mã nguồn mở dành cho Android, được thiết kế để hoạt động chủ yếu trên các thiết bị cục bộ. Khung "ưu tiên biên" này thực hiện các quy trình điều khiển cốt lõi, nhận thức và thực thi ngay trên thiết bị, chỉ sử dụng các mô hình dựa trên đám mây cho các tác vụ suy luận phức tạp. X-OmniClaw nhằm mục đích biến điện thoại thông minh thành trợ lý AI liên tục, tích hợp các đầu vào từ camera, màn hình và giọng nói để thực hiện các hành động trong các ứng dụng thực tế. Kiến trúc của khung bao gồm ba thành phần: nhận thức, thực thi và bộ nhớ. Lớp nhận thức sử dụng mô hình ngôn ngữ-thị giác để hiểu các cảnh vật, trong khi lớp thực thi xác định các giao diện để điều hướng và tương tác. Lớp bộ nhớ giữ lại thông tin ngữ cảnh qua các tác vụ. X-OmniClaw cũng có tính năng sao chép hành vi, cho phép hệ thống tái tạo các đường đi do người dùng trình diễn bằng cách sử dụng deeplink Android, và nhấn mạnh bộ nhớ ngữ nghĩa dài hạn để tăng cường tính liên tục của tác vụ. Dự án, dựa trên mã nguồn HermesApp, có sẵn trên GitHub, với kế hoạch cập nhật thêm từ OPPO.