Làm quen với AI tích hợp sẵn

Alexandra Klepper
Alexandra Klepper

Xuất bản: Ngày 12 tháng 12 năm 2024, Cập nhật lần gần đây nhất: Ngày 20 tháng 5 năm 2025

Với các API AI tích hợp, ứng dụng web của bạn có thể thực hiện các tác vụ dựa trên AI mà không cần triển khai hoặc quản lý các mô hình AI của riêng mình. Chúng tôi đang nỗ lực chuẩn hoá những API này trên các trình duyệt.

Yêu cầu

Để sử dụng AI tích hợp, bạn phải đáp ứng các yêu cầu về mô hình và phần cứng.

Mô hình

Translator API và Language Detector API sử dụng các mô hình chuyên gia. Tất cả các API khác đều sử dụng một mô hình ngôn ngữ, được thiết kế để chạy cục bộ trên máy tính và máy tính xách tay.

Summarizer API, Writer API, Rewriter API và Proofreader API chỉ hỗ trợ phương thức văn bản sang văn bản. Prompt API có các chức năng đa phương thức.

Gemini Nano trong Chrome

Trên Chrome, mô hình ngôn ngữ là Gemini Nano. Gemini Nano không hoạt động trên thiết bị di động.

Kể từ Chrome 140, Gemini Nano hỗ trợ tiếng Anh, tiếng Tây Ban Nha và tiếng Nhật cho văn bản đầu vào và đầu ra.

Trước khi sử dụng các API AI tích hợp, hãy xác nhận Chính sách của Google về các hành vi bị cấm khi sử dụng AI tạo sinh.

Phần cứng

Nhà phát triển và người dùng vận hành các tính năng bằng những API này trong Chrome phải đáp ứng các yêu cầu sau. Các trình duyệt khác có thể có các yêu cầu khác về hoạt động.

Language Detector API và Translator API hoạt động trong Chrome trên máy tính. Các API này không hoạt động trên thiết bị di động. Prompt API, Summarizer API, Writer API, Rewriter API và Proofreader API hoạt động trong Chrome khi đáp ứng các điều kiện sau:

  • Hệ điều hành: Windows 10 hoặc 11; macOS 13 trở lên (Ventura trở lên); Linux; hoặc ChromeOS (từ Platform 16389.0.0 trở lên) trên các thiết bị Chromebook Plus. Chrome dành cho Android, iOS và ChromeOS trên các thiết bị không phải Chromebook Plus hiện chưa được các API sử dụng Gemini Nano hỗ trợ.
  • Bộ nhớ: Ít nhất 22 GB dung lượng trống trên ổ đĩa chứa hồ sơ Chrome của bạn.
  • GPU: VRAM phải lớn hơn 4 GB.
  • Mạng: Gói dữ liệu không giới hạn hoặc kết nối không đo lượng dữ liệu.

Kích thước chính xác của Gemini Nano có thể thay đổi khi trình duyệt cập nhật mô hình. Để xác định kích thước hiện tại, hãy truy cập vào chrome://on-device-internals.

Bắt đầu xây dựng

Hiện có một số API trí tuệ nhân tạo tích hợp sẵn ở các giai đoạn phát triển khác nhau. Một số có trong phiên bản Chrome ổn định, một số có sẵn cho những người tham gia dùng thử nguồn gốc và một số khác chỉ có sẵn cho người tham gia Chương trình dùng thử sớm.

Mỗi API đều có một bộ hướng dẫn riêng để bắt đầu và tải mô hình xuống, cả cho việc tạo mẫu cục bộ và trong môi trường phát hành chính thức bằng các thử nghiệm nguồn gốc.

Bạn có thể sử dụng tất cả các API này khi tạo Tiện ích Chrome.

Tải mô hình xuống

Các API được tích hợp vào Chrome, cũng như các mô hình. Lần đầu tiên người dùng tương tác với các API này, mô hình phải được tải xuống trình duyệt.

Để xác định xem một API có dùng được hay không, hãy gọi hàm availability() không đồng bộ. Hàm này sẽ trả về một promise với một trong các giá trị sau:

  • "unavailable": Thiết bị của người dùng hoặc các lựa chọn về phiên được yêu cầu không được hỗ trợ. Thiết bị có thể không đủ nguồn điện hoặc dung lượng ổ đĩa.
  • "downloadable": Bạn cần tải thêm nội dung xuống để tạo một phiên, có thể bao gồm một mô hình chuyên gia, một mô hình ngôn ngữ hoặc tinh chỉnh. Bạn có thể phải kích hoạt người dùng để gọi create().
  • "downloading": Quá trình tải xuống đang diễn ra và phải hoàn tất trước khi bạn có thể sử dụng một phiên.
  • "available": Bạn có thể tạo một phiên ngay lập tức.

Kích hoạt người dùng

Nếu thiết bị có thể hỗ trợ các API AI tích hợp nhưng mô hình chưa có sẵn, thì người dùng cần tương tác để bắt đầu một phiên với create().

Sử dụng thuộc tính UserActivation.isActive để xác nhận một lượt kích hoạt của người dùng, có thể là một lượt nhấp, lượt nhấn hoặc lượt nhấn phím.

// Check for user activation.
if (navigator.userActivation.isActive) {
  // Create an instance of a built-in API
}

Ví dụ: với Summarizer API, bạn có thể yêu cầu người dùng tương tác với nút có nội dung "Tóm tắt" để kích hoạt Summarizer.create().

Sử dụng API trên localhost

Tất cả các API đều có trên localhost trong Chrome.

  1. Chuyển đến chrome://flags/#prompt-api-for-gemini-nano-multimodal-input.
  2. Chọn Bật.
  3. Nhấp vào Chạy lại hoặc khởi động lại Chrome.

Để xác nhận Gemini Nano đã tải xuống và hoạt động như dự kiến, hãy mở Công cụ cho nhà phát triển rồi nhập await LanguageModel.availability(); vào bảng điều khiển. Thao tác này sẽ trả về available.

Khắc phục sự cố localhost

Nếu mô hình không hoạt động như mong đợi, hãy làm theo các bước sau:

  1. Khởi động lại Chrome.
  2. Chuyển đến chrome://on-device-internals.
  3. Chọn thẻ Model Status (Trạng thái mô hình) và đảm bảo không có lỗi.
  4. Mở Công cụ cho nhà phát triển rồi nhập LanguageModel.availability(); vào bảng điều khiển. Thao tác này sẽ trả về available.

Nếu cần, hãy đợi một lúc rồi lặp lại các bước này.

Quy trình tiêu chuẩn

Chúng tôi đang nỗ lực chuẩn hoá các API này để chúng hoạt động trên mọi trình duyệt. Điều này có nghĩa là chúng tôi đã đề xuất các API này cho cộng đồng nền tảng web và chuyển chúng sang Nhóm cộng đồng ươm tạo web của W3C để thảo luận thêm.

Chúng tôi đang yêu cầu W3C, Mozilla và WebKit đưa ra ý kiến phản hồi cho từng API.

Tương tác và chia sẻ ý kiến phản hồi

Nếu bạn dùng thử AI tích hợp và có ý kiến phản hồi, vui lòng chia sẻ với chúng tôi.