Указатель мыши был одной из величайших констант технологий. Google сказал, что это длилось слишком долго
Google превратил курсор мыши в агента искусственного интеллекта, который считывает контекст того, на что вы указываете. Это отдельная теория о том, как ИИ должен работать на компьютере.
Google DeepMind опубликовал принципы и демонстрационные версии Magic Pointer, указателя мыши на базе Gemini, который понимает, на что вы указываете и почему. Ничего не набирая. Просто наведение.
Почему это важно. Чат-бот в качестве основного интерфейса уже два года является доминирующей моделью в искусственном интеллекте: вы открываете окно, вводите текст и получаете ответ. Magic Pointer предлагает обратное: ИИ перемещается с вами по экрану, читает то, что у вас перед глазами, и действует без вашего объяснения контекста. Если он работает так, как обещает, текстовое поле перестает быть воротами в ИИ.
Логика, лежащая в основе проекта, заключается в том, что проблема современного ИИ заключается не в его способности, а в том, что его сложно использовать. Каждый раз, когда вы хотите о чем-то попросить модель, вы должны перетаскивать в нее свой мир: открывать окно, вставлять текст, объяснять контекст с нуля и т. Д. Magic Pointer меняет этот поток на противоположный: ИИ идет туда, где находится курсор.
Подробно. Система фиксирует визуальный и семантический контекст вокруг указателя. Вы указываете дату в электронном письме, и Близнецы предлагают вам создать событие. Вы выбираете два изображения — диван и свою гостиную — и модель их составляет. Вы наводите курсор на таблицу и можете запросить диаграмму, не открывая больше ни одного приложения.
Цель состоит в том, чтобы заменить длинные подсказки тем, что DeepMind называет «естественным сокращением»: указать на что-то, сказать, что вы хотите, и система заполнит пробелы.
- В Google AI Studio есть живые демонстрации, и система уже доступна в Chrome.
- Осенью он появится в Googlebook, новом ноутбуке от Google, производителями которого являются Acer, Asus, Dell, HP и Lenovo.
Между строк. Мы рассматриваем три способа внедрить ИИ в компьютер:
- Apple интегрирует его в каждое приложение.
- Microsoft помещает Copilot на боковую панель.
- Google помещает Gemini внутрь самого указывающего устройства: оно находится не в фоновом режиме, это курсор, это виджет, это интерфейс между пользователем и машиной.
Последнее — философская ставка. И это имеет последствия для модели чат-ботов: если курсор действует как контекстный агент, окно чата теряет свою монополию в качестве точки входа.
Да, но. Googlebook поступит в продажу осенью как продукт премиум-класса, цена пока не объявлена. Экосистема Android для настольных ПК остается слабым местом: если разработчики не создают собственные приложения для большого экрана, Magic Pointer указывает на мир, которого еще не существует. И на любом рынке, где Gemini ограничен законодательством, все предложение становится пустым.
Редактор: Анастасия Богатырчук