Компания Google объявила о запуске новой специализированной модели Gemini 2.5 Computer Use, предназначенной для управления пользовательскими интерфейсами (UI) и взаимодействия с ними. По заявлению разработчиков, модель демонстрирует более высокие результаты по сравнению с ведущими альтернативами на ряде ключевых бенчмарков для веб- и мобильных приложений.

Презентация и возможности модели
На конференции Google I/O ранее в этом году компания сообщила о планах внедрить функции управления компьютером в Gemini API. Теперь представлен новый инструмент, который позволяет агентам выполнять действия в интерфейсах, анализируя окружение и историю взаимодействий.
Принцип работы следующий:
-
разработчики передают в инструмент запрос пользователя вместе со скриншотом среды и историей последних действий;
-
дополнительно можно указать исключения из списка поддерживаемых функций или добавить собственные;
-
модель анализирует входные данные и формирует ответ в виде конкретного действия, например нажатия кнопки или ввода текста;
-
при неопределённости система может запросить подтверждение у конечного пользователя, особенно если речь идёт о действиях, связанных с покупками;
-
клиентский код выполняет полученное действие, после чего обновлённый скриншот и текущий URL возвращаются в модель, что запускает новый цикл;
-
процесс повторяется до достижения основной цели задачи.

Оптимизация и ограничения
Google отмечает, что Gemini 2.5 Computer Use оптимизирована для работы в веб-браузерах, но также показывает высокую эффективность при управлении мобильными интерфейсами. При этом компания уточняет, что модель пока не адаптирована для полноценного контроля на уровне настольных операционных систем.
Доступность модели
Модель уже доступна в режиме публичного предварительного просмотра. Разработчики могут протестировать её через Gemini API в сервисах Google AI Studio и Vertex AI.
Gemini 2.5 Computer Use позиционируется как инструмент для автоматизации взаимодействия с интерфейсами и выполнения сложных пользовательских сценариев. По данным Google, модель демонстрирует передовые результаты на ряде тестов, что делает её перспективным решением для интеграции в веб- и мобильные приложения.
Обновления программ, что нового
• Утечка: Snapdragon 8 Elite Gen 6 может получить систему охлаждения от Samsung Exynos
• Утечка: Honor 600 может получить аккумулятор емкостью 9000 мАч
• Стартовала бета-версия HyperOS 3.1 для 10 новых устройств: номера сборок для России и глобального рынка
• Покупатели Яндекс Маркета смогут создавать ИИ-подборки товаров под конкретные задачи
• Обновления безопасности Samsung за февраль 2026 года: список устройств с ежемесячными патчами
• OpenAI представляет новую модель для программирования GPT-5.3-Codex — на 25% быстрее предшественника