OPPO의 Multi-X 팀은 주로 로컬 장치에서 작동하도록 설계된 오픈 소스 Android AI 에이전트 프레임워크인 X-OmniClaw를 공개했습니다. 이 "엣지 우선" 프레임워크는 핵심 제어, 인지 및 실행 프로세스를 장치 자체에서 수행하며, 복잡한 추론 작업에만 클라우드 기반 모델을 활용합니다. X-OmniClaw는 스마트폰을 지속적인 AI 비서로 변모시키는 것을 목표로 하며, 카메라, 화면, 음성 입력을 통합하여 실제 앱 내에서 작업을 수행합니다. 이 프레임워크의 아키텍처는 인지, 실행, 메모리의 세 가지 구성 요소로 이루어져 있습니다. 인지 계층은 장면을 이해하기 위해 비전-언어 모델을 사용하며, 실행 계층은 탐색 및 상호작용을 위한 인터페이스를 식별합니다. 메모리 계층은 작업 간의 맥락 정보를 유지합니다. X-OmniClaw는 또한 행동 복제를 특징으로 하여 Android 딥링크를 사용해 사용자가 시연한 경로를 복제할 수 있으며, 향상된 작업 연속성을 위해 장기 의미 메모리를 강조합니다. HermesApp 코드베이스를 기반으로 한 이 프로젝트는 GitHub에서 공개되어 있으며, OPPO는 추가 업데이트를 계획하고 있습니다.