Начните работу со встроенным искусственным интеллектом

Александра Клеппер
Alexandra Klepper

Опубликовано: 12 декабря 2024 г., Последнее обновление: 20 мая 2025 г.

Благодаря встроенным API для искусственного интеллекта ваше веб-приложение сможет выполнять задачи на базе искусственного интеллекта без необходимости развертывания и управления собственными моделями искусственного интеллекта. Мы работаем над стандартизацией этих API для всех браузеров .

Требования

Для использования встроенного ИИ существуют требования к модели и оборудованию.

Модели

API переводчика и определителя языка используют экспертные модели. Все остальные API используют языковую модель, разработанную для локального запуска на настольных компьютерах и ноутбуках.

API Summarizer, Writer, Rewriter и Proofreader поддерживают только модальность «текст-текст». API Prompt поддерживает многомодальные функции .

Gemini Nano в Chrome

В Chrome используется языковая модель Gemini Nano. Gemini Nano недоступна на мобильных устройствах.

Начиная с Chrome 140, Gemini Nano поддерживает английский, испанский и японский языки для ввода и вывода текста.

Прежде чем использовать встроенные API ИИ, ознакомьтесь с Политикой Google в отношении запрещенного использования генеративного ИИ .

Аппаратное обеспечение

Для разработчиков и пользователей, использующих эти API в Chrome, действуют следующие требования. Требования к работе других браузеров могут отличаться.

API определения языка и переводчика работают в Chrome на десктопе. Эти API не работают на мобильных устройствах. API Prompt, API Summarizer, API Writer, API Rewriter и API Proofreader работают в Chrome при соблюдении следующих условий:

  • Операционная система : Windows 10 или 11; macOS 13+ (Ventura и выше); Linux; или ChromeOS (начиная с платформы 16389.0.0 и выше) на устройствах Chromebook Plus . Chrome для Android, iOS и ChromeOS на устройствах, отличных от Chromebook Plus, пока не поддерживаются API, использующими Gemini Nano.
  • Хранилище : не менее 22 ГБ свободного места на томе, содержащем ваш профиль Chrome.
  • Видеокарта : строго более 4 ГБ видеопамяти.
  • Сеть : Безлимитные данные или безлимитное соединение.

Точный размер Gemini Nano может меняться по мере обновления модели браузером. Чтобы узнать текущий размер, посетите chrome://on-device-internals .

Начать строительство

Существует несколько встроенных API для искусственного интеллекта, находящихся на разных стадиях разработки. Некоторые из них доступны в стабильной версии Chrome, другие — участникам тестовой версии Origin, а третьи — только участникам программы раннего ознакомления .

Каждый API имеет собственный набор инструкций по началу работы и загрузке модели как для локального прототипирования, так и для производственных сред с исходными пробными версиями.

Все эти API можно использовать при создании расширений Chrome.

Загрузка модели

API, как и модели, встроены в Chrome. При первом взаимодействии пользователя с этими API модель необходимо загрузить в браузер.

Чтобы определить, пригоден ли и готов ли API к использованию, вызовите асинхронную функцию availability() , которая возвращает обещание с одним из следующих значений:

  • "unavailable" : Устройство пользователя или запрошенные параметры сеанса не поддерживаются. Возможно, на устройстве недостаточно заряда батареи или места на диске.
  • "downloadable" : для создания сеанса требуются дополнительные загрузки, которые могут включать экспертную модель, языковую модель или тонкую настройку. Для вызова create() может потребоваться активация пользователя .
  • "downloading" : идет загрузка, которая должна быть завершена, прежде чем вы сможете использовать сеанс.
  • "available" : вы можете создать сеанс немедленно.

Активация пользователя

Если устройство может поддерживать встроенные API ИИ, но модель еще недоступна, для запуска сеанса с помощью create() требуется взаимодействие с пользователем.

Используйте свойство UserActivation.isActive для подтверждения активации пользователя, которая может быть щелчком, касанием или нажатием клавиши.

// Check for user activation.
if (navigator.userActivation.isActive) {
  // Create an instance of a built-in API
}

Например, с помощью API Summarizer вы можете попросить пользователей взаимодействовать с кнопкой с надписью «Summarize» для активации Summarizer.create() .

Используйте API на локальном хосте

Все API доступны на localhost в Chrome.

  1. Перейдите по адресу chrome://flags/#prompt-api-for-gemini-nano-multimodal-input .
  2. Выберите Включено .
  3. Нажмите «Перезапустить» или перезапустите Chrome.

Чтобы убедиться, что Gemini Nano загружен и работает как задумано, откройте DevTools и введите в консоли await LanguageModel.availability(); Должно быть возвращено значение available .

Устранение неполадок локального хоста

Если модель не работает так, как ожидалось, выполните следующие действия:

  1. Перезапустите Chrome.
  2. Перейдите по адресу chrome://on-device-internals .
  3. Выберите вкладку «Статус модели» и убедитесь в отсутствии ошибок.
  4. Откройте DevTools и введите в консоли LanguageModel.availability(); Должен быть возвращен available .

При необходимости подождите некоторое время и повторите эти действия.

Процесс стандартизации

Мы работаем над стандартизацией этих API , чтобы они работали во всех браузерах. Это означает, что мы предложили эти API сообществу веб-платформ и перенесли их в группу сообщества W3C Web Incubator для дальнейшего обсуждения.

Мы запрашиваем отзывы от W3C, Mozilla и WebKit по каждому API.

Привлекайте и делитесь отзывами

Если вы попробуете встроенный ИИ и у вас есть отзывы, мы будем рады их услышать.