Gemini Nano cho phép bạn mang đến trải nghiệm AI tạo sinh phong phú mà không cần kết nối mạng hoặc gửi dữ liệu lên đám mây. AI trên thiết bị là một giải pháp tuyệt vời cho các trường hợp sử dụng mà chi phí thấp và các biện pháp bảo vệ quyền riêng tư là mối quan tâm hàng đầu của bạn.
Đối với các trường hợp sử dụng trên thiết bị, bạn có thể tận dụng mô hình nền tảng Gemini Nano của Google. Gemini Nano chạy trong dịch vụ hệ thống AICore của Android, tận dụng phần cứng của thiết bị để cho phép độ trễ suy luận thấp và luôn cập nhật mô hình.
API GenAI của Bộ công cụ học máy
Các API GenAI của Bộ công cụ học máy khai thác sức mạnh của Gemini Nano để giúp ứng dụng của bạn thực hiện các tác vụ. Các API này cung cấp chất lượng sẵn có cho các trường hợp sử dụng phổ biến thông qua một giao diện cấp cao. Các API AI tạo sinh của Bộ công cụ học máy được xây dựng dựa trên AICore, một dịch vụ hệ thống Android cho phép thực thi các mô hình nền tảng AI tạo sinh trên thiết bị để tạo điều kiện cho các tính năng như chức năng của ứng dụng nâng cao và cải thiện quyền riêng tư của người dùng bằng cách xử lý dữ liệu cục bộ. Tìm hiểu thêm.
Các tính năng chính
Các API GenAI của Bộ công cụ học máy hỗ trợ các tính năng sau:
- Câu lệnh: Tạo nội dung văn bản dựa trên câu lệnh tuỳ chỉnh chỉ có văn bản hoặc câu lệnh đa phương thức.
- Tóm tắt: Tóm tắt bài viết hoặc cuộc trò chuyện dưới dạng danh sách có dấu đầu dòng.
- Hiệu đính: Hiệu đính tin nhắn trò chuyện ngắn.
- Viết lại: Viết lại tin nhắn trò chuyện ngắn theo nhiều giọng điệu hoặc phong cách.
- Mô tả hình ảnh: Tạo nội dung mô tả ngắn về một hình ảnh nhất định.
- Nhận dạng giọng nói: Chuyển âm thanh lời nói thành văn bản.
Kiến trúc thông qua AICore
Là một mô-đun cấp hệ thống, bạn truy cập vào AICore thông qua một loạt API để chạy suy luận trên thiết bị. Ngoài ra, AICore có một số tính năng an toàn tích hợp, đảm bảo đánh giá kỹ lưỡng dựa trên các bộ lọc an toàn của chúng tôi. Sơ đồ sau đây trình bày cách một ứng dụng truy cập vào AICore để chạy Gemini Nano trên thiết bị.
Bảo mật và giữ riêng tư dữ liệu người dùng
AI tạo sinh trên thiết bị thực thi các câu lệnh cục bộ, loại bỏ các lệnh gọi máy chủ. Mặc dù điều này giúp loại bỏ độ trễ mạng, nhưng tốc độ suy luận phụ thuộc vào phần cứng của thiết bị. Phương pháp này giúp tăng cường quyền riêng tư bằng cách giữ dữ liệu nhạy cảm trên thiết bị, cho phép chức năng ngoại tuyến và giảm chi phí suy luận.
AICore tuân thủ các nguyên tắc của Lõi điện toán riêng tư, với các đặc điểm chính sau:
- Liên kết gói bị hạn chế: AICore được tách biệt khỏi hầu hết các gói khác, với một số trường hợp ngoại lệ hạn chế đối với các gói hệ thống cụ thể. Mọi sửa đổi đối với danh sách được phép này chỉ có thể xảy ra trong quá trình cập nhật OTA Android đầy đủ.
- Truy cập Internet gián tiếp: AICore không có quyền truy cập trực tiếp vào Internet. Tất cả các yêu cầu Internet, bao gồm cả việc tải mô hình xuống, đều được định tuyến thông qua APK đồng hành Dịch vụ điện toán riêng tư nguồn mở. Các API trong Dịch vụ điện toán riêng tư phải thể hiện rõ bản chất tập trung vào quyền riêng tư của chúng.
Ngoài ra, AICore được xây dựng để tách biệt từng yêu cầu và không lưu trữ bất kỳ bản ghi nào về dữ liệu đầu vào hoặc đầu ra kết quả sau khi xử lý để bảo vệ quyền riêng tư của người dùng. Đọc bài đăng trên blog Giới thiệu về quyền riêng tư và tính an toàn cho Gemini Nano để tìm hiểu thêm.
Lợi ích của việc truy cập vào các mô hình nền tảng AI bằng AICore
AICore cho phép hệ điều hành Android cung cấp và quản lý các mô hình nền tảng AI. Điều này giúp giảm đáng kể chi phí sử dụng các mô hình lớn này trong ứng dụng của bạn, chủ yếu là do những lý do sau:
- Dễ dàng triển khai: AICore quản lý việc phân phối Gemini Nano và xử lý các bản cập nhật trong tương lai. Bạn không cần lo lắng về việc tải xuống hoặc cập nhật các mô hình lớn qua mạng, cũng như không ảnh hưởng đến ngân sách bộ nhớ thời gian chạy và ổ đĩa của ứng dụng.
- Tăng tốc suy luận: AICore tận dụng phần cứng trên thiết bị để tăng tốc suy luận. Ứng dụng của bạn đạt được hiệu suất tốt nhất trên mỗi thiết bị và bạn không cần lo lắng về các giao diện phần cứng cơ bản.