Google DeepMind đã ra mắt Gemini Robotics-ER 1.6, một mô hình suy luận cấp cao mới giúp nâng cao đáng kể khả năng của robot trong việc suy luận không gian và hiểu đa góc nhìn. Có sẵn thông qua Gemini API và Google AI Studio, mô hình này giới thiệu ba nâng cấp chính: cải thiện độ chính xác khi chỉ điểm, phát hiện thành công đa góc nhìn và khả năng đọc thiết bị tiên tiến. Những cải tiến này cho phép robot thực hiện phát hiện vật thể chính xác, tích hợp nhiều nguồn cấp dữ liệu camera để hoàn thành nhiệm vụ và giải mã các thiết bị công nghiệp khác nhau bằng thị giác tác nhân. Boston Dynamics đã tích hợp Gemini Robotics-ER 1.6 vào sản phẩm Orbit AIVI-Learning của mình, cho phép robot Spot tự động tuần tra các khu công nghiệp và đọc dữ liệu từ các thiết bị như đồng hồ đo áp suất. Sự tích hợp này, có hiệu lực từ ngày 8 tháng 4, nâng cao hiệu suất của Spot trong các nhiệm vụ như kiểm tra bằng hình ảnh và phát hiện tụ dịch lỏng. DeepMind nhấn mạnh ER 1.6 là mô hình an toàn nhất của họ, với khả năng tuân thủ vượt trội trong các bài kiểm tra hướng dẫn an toàn và nhận diện rủi ro so với các mô hình trước đó.