Логотип

Указатель мыши был одной из величайших констант технологий. Google сказал, что это длилось слишком долго

Указатель мыши был одной из величайших констант технологий. Google сказал, что это длилось слишком долго

Google превратил курсор мыши в агента искусственного интеллекта, который считывает контекст того, на что вы указываете. Это отдельная теория о том, как ИИ должен работать на компьютере.

Google DeepMind опубликовал принципы и демонстрационные версии Magic Pointer, указателя мыши на базе Gemini, который понимает, на что вы указываете и почему. Ничего не набирая. Просто наведение.

Почему это важно. Чат-бот в качестве основного интерфейса уже два года является доминирующей моделью в искусственном интеллекте: вы открываете окно, вводите текст и получаете ответ. Magic Pointer предлагает обратное: ИИ перемещается с вами по экрану, читает то, что у вас перед глазами, и действует без вашего объяснения контекста. Если он работает так, как обещает, текстовое поле перестает быть воротами в ИИ.

Логика, лежащая в основе проекта, заключается в том, что проблема современного ИИ заключается не в его способности, а в том, что его сложно использовать. Каждый раз, когда вы хотите о чем-то попросить модель, вы должны перетаскивать в нее свой мир: открывать окно, вставлять текст, объяснять контекст с нуля и т. Д. Magic Pointer меняет этот поток на противоположный: ИИ идет туда, где находится курсор.

Подробно. Система фиксирует визуальный и семантический контекст вокруг указателя. Вы указываете дату в электронном письме, и Близнецы предлагают вам создать событие. Вы выбираете два изображения — диван и свою гостиную — и модель их составляет. Вы наводите курсор на таблицу и можете запросить диаграмму, не открывая больше ни одного приложения.

Цель состоит в том, чтобы заменить длинные подсказки тем, что DeepMind называет «естественным сокращением»: указать на что-то, сказать, что вы хотите, и система заполнит пробелы.

  • В Google AI Studio есть живые демонстрации, и система уже доступна в Chrome.
  • Осенью он появится в Googlebook, новом ноутбуке от Google, производителями которого являются Acer, Asus, Dell, HP и Lenovo.
Читать  В рекламе ChatGPT от OpenAI якобы будет отдаваться предпочтение спонсируемому контенту в ответах

Между строк. Мы рассматриваем три способа внедрить ИИ в компьютер:

  1. Apple интегрирует его в каждое приложение.
  2. Microsoft помещает Copilot на боковую панель.
  3. Google помещает Gemini внутрь самого указывающего устройства: оно находится не в фоновом режиме, это курсор, это виджет, это интерфейс между пользователем и машиной.

Последнее — философская ставка. И это имеет последствия для модели чат-ботов: если курсор действует как контекстный агент, окно чата теряет свою монополию в качестве точки входа.

Да, но. Googlebook поступит в продажу осенью как продукт премиум-класса, цена пока не объявлена. Экосистема Android для настольных ПК остается слабым местом: если разработчики не создают собственные приложения для большого экрана, Magic Pointer указывает на мир, которого еще не существует. И на любом рынке, где Gemini ограничен законодательством, все предложение становится пустым.

Редактор: Анастасия Богатырчук

Рейтинг: 5 (1 голос)
Если статья понравилась, то поделитесь ей в социальных сетях:

Оставить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

4 × четыре =

Это может быть вам интересно


Спасибо!

Теперь редакторы в курсе.

Прокрутить страницу до начала