Fecha de publicación: 12 de diciembre de 2024; última actualización: 20 de mayo de 2025
Con las APIs de IA integradas, tu aplicación web puede realizar tareas potenciadas por IA sin necesidad de implementar ni administrar sus propios modelos de IA. Estamos trabajando para estandarizar estas APIs en todos los navegadores.
Requisitos
Para usar la IA integrada, hay requisitos de hardware y modelos.
Modelos
Las APIs de Translator y Language Detector usan modelos expertos. Todas las demás APIs usan un modelo de lenguaje diseñado para ejecutarse de forma local en computadoras de escritorio y laptops.
Las APIs de Summarizer, Writer, Rewriter y Proofreader solo admiten la modalidad de texto a texto. La API de Prompt tiene capacidades multimodales.
Gemini Nano en Chrome
En Chrome, el modelo de lenguaje es Gemini Nano. Gemini Nano no está disponible en dispositivos móviles.
A partir de Chrome 140, Gemini Nano admite inglés, español y japonés para el texto de entrada y salida.
Antes de usar las APIs de IA integradas, acepta la Política de Uso Prohibido de IA Generativas de Google.
Hardware
Existen los siguientes requisitos para los desarrolladores y los usuarios que operan funciones con estas APIs en Chrome. Es posible que otros navegadores tengan requisitos de funcionamiento diferentes.
Las APIs de Language Detector y Translator funcionan en Chrome en computadoras de escritorio. Estas APIs no funcionan en dispositivos móviles. Las APIs de Prompt, Summarizer, Writer, Rewriter y Proofreader funcionan en Chrome cuando se cumplen las siguientes condiciones:
- Sistema operativo: Windows 10 o 11; macOS 13 o versiones posteriores (Ventura y versiones posteriores); Linux; o ChromeOS (a partir de la plataforma 16389.0.0) en dispositivos Chromebook Plus Las APIs que usan Gemini Nano aún no son compatibles con Chrome para Android, iOS y ChromeOS en dispositivos que no son Chromebook Plus.
- Almacenamiento: Al menos 22 GB de espacio libre en el volumen que contiene tu perfil de Chrome
- GPU: Estrictamente más de 4 GB de VRAM
- Red: Datos ilimitados o una conexión no medida
El tamaño exacto de Gemini Nano puede variar a medida que el navegador actualiza el modelo. Para determinar el tamaño actual, visita chrome://on-device-internals
.
Comienza con la compilación
Existen varias APIs de IA integradas disponibles en diferentes etapas de desarrollo. Algunas están en la versión estable de Chrome, otras están disponibles para los participantes de las pruebas de origen y otras solo están disponibles para los participantes del Programa de vista previa anticipada.
Cada API tiene su propio conjunto de instrucciones para comenzar y descargar el modelo, tanto para la creación de prototipos locales como en entornos de producción con las pruebas de origen.
- API de Translator
- API de Language Detector
- API de Summarizer
- API de Writer y API de Rewriter
- API de Proofreader
- API de Prompt
Todas estas APIs se pueden usar cuando se compilan extensiones de Chrome.
Descarga de modelos
Las APIs están integradas en Chrome, al igual que los modelos. La primera vez que un usuario interactúa con estas APIs, el modelo se debe descargar en el navegador.
Para determinar si una API está lista y se puede usar, llama a la función asíncrona availability()
, que devuelve una promesa con uno de los siguientes valores:
"unavailable"
: No se admiten el dispositivo del usuario ni las opciones de sesión solicitadas. Es posible que el dispositivo no tenga suficiente energía o espacio en el disco."downloadable"
: Se necesitan descargas adicionales para crear una sesión, que pueden incluir un modelo experto, un modelo de lenguaje o un ajuste. Es posible que se requiera la activación del usuario para llamar acreate()
."downloading"
: Las descargas están en curso y deben completarse antes de que puedas usar una sesión."available"
: Puedes crear una sesión de inmediato.
Activación del usuario
Si el dispositivo admite las APIs de IA integradas, pero el modelo aún no está disponible, se requiere una interacción del usuario para iniciar una sesión con create()
.
Usa la propiedad UserActivation.isActive
para confirmar la activación del usuario, que podría ser un clic, un toque o una presión de tecla.
// Check for user activation.
if (navigator.userActivation.isActive) {
// Create an instance of a built-in API
}
Por ejemplo, con la API de Summarizer, podrías pedirles a los usuarios que interactúen con un botón que diga "Resumir" para activar Summarizer.create()
.
Usa APIs en localhost
Todas las APIs están disponibles en localhost
en Chrome.
- Ve a
chrome://flags/#prompt-api-for-gemini-nano-multimodal-input
. - Selecciona Habilitada.
- Haz clic en Reiniciar o reinicia Chrome.
Para confirmar que Gemini Nano se descargó y funciona según lo previsto, abre Herramientas para desarrolladores y escribe await LanguageModel.availability();
en la consola. Esto debería mostrar available
.
Soluciona problemas relacionados con localhost
Si el modelo no funciona como se espera, sigue estos pasos:
- Reinicia Chrome.
- Ve a
chrome://on-device-internals
. - Selecciona la pestaña Estado del modelo y asegúrate de que no haya errores.
- Abre Herramientas para desarrolladores y escribe
LanguageModel.availability();
en la consola. Esto debería mostraravailable
.
Si es necesario, espera un tiempo y repite estos pasos.
Proceso de estándares
Estamos trabajando para estandarizar estas APIs y que funcionen en todos los navegadores. Esto significa que propusimos las APIs a la comunidad de plataformas web y las trasladamos al W3C Web Incubator Community Group para seguir debatiéndolas.
Estamos solicitando comentarios del W3C, Mozilla y WebKit para cada API.
Interactúa y comparte comentarios
Si pruebas la IA integrada y tienes comentarios, nos encantaría conocerlos.
- Descubre todas las APIs de IA integradas.
- Únete al Programa de Versión Preliminar Anticipada para ver un adelanto de las nuevas APIs y acceder a nuestra lista de distribución.
- Si tienes comentarios sobre la implementación de Chrome, informa un error de Chromium.
- Obtén información sobre los estándares web.