Erste Schritte mit integrierter KI

Alexandra Klepper
Alexandra Klepper

Veröffentlicht am 12. Dezember 2024, zuletzt aktualisiert am 20. Mai 2025

Mit integrierten KI-APIs kann Ihre Webanwendung KI-basierte Aufgaben ausführen, ohne dass Sie eigene KI-Modelle bereitstellen oder verwalten müssen. Wir arbeiten daran, diese APIs browserübergreifend zu standardisieren.

Voraussetzungen

Für die Nutzung der integrierten KI gelten Modell- und Hardwareanforderungen.

Modelle

Die Translator API und die Language Detector API verwenden Expertenmodelle. Für alle anderen APIs wird ein Sprachmodell verwendet, das für die lokale Ausführung auf Computern und Laptops entwickelt wurde.

Die Summarizer API, Writer API, Rewriter API und Proofreader API unterstützen nur die Text-zu-Text-Modalität. Die Prompt API bietet multimodale Funktionen.

Gemini Nano in Chrome

In Chrome ist das Sprachmodell Gemini Nano. Gemini Nano ist auf Mobilgeräten nicht verfügbar.

Ab Chrome 140 unterstützt Gemini Nano Englisch, Spanisch und Japanisch für Eingabe- und Ausgabetext.

Bevor Sie die integrierten KI-APIs verwenden, müssen Sie die Richtlinie zur unzulässigen Nutzung von generativer KI von Google bestätigen.

Hardware

Für Entwickler und Nutzer, die Funktionen mit diesen APIs in Chrome verwenden, gelten die folgenden Anforderungen. Bei anderen Browsern gelten möglicherweise andere Betriebsanforderungen.

Die APIs für die Spracherkennung und die Übersetzung funktionieren in Chrome auf dem Computer. Diese APIs funktionieren nicht auf Mobilgeräten. Die Prompt API, Summarizer API, Writer API, Rewriter API und Proofreader API funktionieren in Chrome, wenn die folgenden Bedingungen erfüllt sind:

  • Betriebssystem: Windows 10 oder 11; macOS 13 oder höher (Ventura und höher); Linux; oder ChromeOS (ab Plattform 16389.0.0) auf Chromebook Plus-Geräten. Chrome für Android, iOS und ChromeOS auf Geräten, die keine Chromebook Plus-Geräte sind, werden von den APIs, die Gemini Nano verwenden, noch nicht unterstützt.
  • Speicher: Auf dem Volume, das Ihr Chrome-Profil enthält, müssen mindestens 22 GB freier Speicherplatz verfügbar sein.
  • GPU: Mehr als 4 GB VRAM.
  • Netzwerk: Unbegrenzte Daten oder eine Verbindung ohne Volumenbegrenzung.

Die genaue Größe von Gemini Nano kann variieren, da das Modell vom Browser aktualisiert wird. Die aktuelle Größe finden Sie unter chrome://on-device-internals.

Gleich mit dem Erstellen loslegen

Es gibt mehrere integrierte KI-APIs, die sich in verschiedenen Entwicklungsphasen befinden. Einige sind in der stabilen Chrome-Version verfügbar, andere für Teilnehmer von Ursprungstests und wieder andere nur für Teilnehmer des Early Preview Program.

Für jede API gibt es eine eigene Anleitung für die ersten Schritte und zum Herunterladen des Modells, sowohl für das lokale Prototyping als auch für Produktionsumgebungen mit den Origin Trials.

Alle diese APIs können beim Erstellen von Chrome-Erweiterungen verwendet werden.

Download des Modells

APIs und Modelle sind in Chrome integriert. Wenn ein Nutzer zum ersten Mal mit diesen APIs interagiert, muss das Modell in den Browser heruntergeladen werden.

Rufen Sie die asynchrone Funktion availability() auf, um festzustellen, ob eine API nutzbar und bereit ist. Sie gibt ein Promise mit einem der folgenden Werte zurück:

  • "unavailable": Das Gerät des Nutzers oder die angeforderten Sitzungsoptionen werden nicht unterstützt. Das Gerät hat möglicherweise nicht genügend Strom oder Speicherplatz.
  • "downloadable": Für die Erstellung einer Sitzung sind zusätzliche Downloads erforderlich, z. B. für ein Expertenmodell, ein Sprachmodell oder das Feinabstimmen. Für den Aufruf von create() ist möglicherweise eine Nutzeraktivierung erforderlich.
  • "downloading": Downloads laufen und müssen abgeschlossen werden, bevor Sie eine Sitzung verwenden können.
  • "available": Sie können sofort eine Sitzung erstellen.

Nutzeraktivierung

Wenn das Gerät die integrierten KI-APIs unterstützen könnte, das Modell aber noch nicht verfügbar ist, ist eine Nutzerinteraktion erforderlich, um eine Sitzung mit create() zu starten.

Verwenden Sie die UserActivation.isActive-Eigenschaft, um eine Nutzeraktivierung zu bestätigen. Das kann ein Klick, ein Tippen oder ein Tastendruck sein.

// Check for user activation.
if (navigator.userActivation.isActive) {
  // Create an instance of a built-in API
}

Mit der Summarizer API können Sie Nutzer beispielsweise auffordern, auf die Schaltfläche „Zusammenfassen“ zu klicken, um Summarizer.create() zu aktivieren.

APIs auf localhost verwenden

Alle APIs sind in Chrome auf localhost verfügbar.

  1. Öffnen Sie chrome://flags/#prompt-api-for-gemini-nano-multimodal-input.
  2. Wählen Sie Aktiviert aus.
  3. Klicken Sie auf Neu starten oder starten Sie Chrome neu.

Um zu prüfen, ob Gemini Nano heruntergeladen wurde und wie vorgesehen funktioniert, öffnen Sie die Entwicklertools und geben Sie await LanguageModel.availability(); in die Konsole ein. In diesem Fall sollte available zurückgegeben werden.

Fehlerbehebung bei localhost

Wenn das Modell nicht wie erwartet funktioniert, gehen Sie so vor:

  1. Starten Sie Chrome neu.
  2. Öffnen Sie chrome://on-device-internals.
  3. Wählen Sie den Tab Model Status (Modellstatus) aus und prüfen Sie, ob Fehler vorliegen.
  4. Öffnen Sie die Entwicklertools und geben Sie LanguageModel.availability(); in die Konsole ein. In diesem Fall sollte available zurückgegeben werden.

Warten Sie gegebenenfalls einige Zeit und wiederholen Sie diese Schritte.

Standards-Prozess

Wir arbeiten daran, diese APIs zu standardisieren, damit sie in allen Browsern funktionieren. Das bedeutet, dass wir die APIs der Webplattform-Community vorgeschlagen und sie zur weiteren Diskussion in die W3C Web Incubator Community Group verschoben haben.

Wir bitten das W3C, Mozilla und WebKit um Feedback zu jeder API.

Feedback geben

Wenn Sie die integrierte KI ausprobieren und Feedback dazu haben, freuen wir uns darauf, von Ihnen zu hören.