تاریخ انتشار: 12 دسامبر 2024، آخرین به روز رسانی: 20 مه 2025
با APIهای AI داخلی ، برنامه وب شما میتواند وظایف مبتنی بر هوش مصنوعی را بدون نیاز به استقرار یا مدیریت مدلهای هوش مصنوعی خود انجام دهد. ما در حال کار برای استانداردسازی این APIها در بین مرورگرها هستیم.
برای استفاده از هوش مصنوعی داخلی، نیازهای مدل و سخت افزار وجود دارد.
API های مترجم و آشکارساز زبان از مدل های خبره استفاده می کنند. همه API های دیگر از یک مدل زبانی استفاده می کنند که برای اجرای محلی روی دسکتاپ و لپ تاپ طراحی شده است.
Summarizer API، Writer API، Rewriter API، و Proofreader API، فقط از حالت متن به متن پشتیبانی می کنند. Prompt API دارای قابلیت های چندوجهی است .
در کروم، مدل زبان Gemini Nano است. Gemini Nano در دستگاه های تلفن همراه در دسترس نیست.
از Chrome 140، Gemini Nano از انگلیسی، اسپانیایی و ژاپنی برای متن ورودی و خروجی پشتیبانی میکند.
قبل از استفاده از APIهای داخلی هوش مصنوعی، خطمشی استفادههای ممنوعه هوش مصنوعی مولد Google را تأیید کنید.
الزامات زیر برای برنامهنویسان و کاربرانی که ویژگیها را با استفاده از این APIها در Chrome اجرا میکنند، وجود دارد. سایر مرورگرها ممکن است شرایط عملیاتی متفاوتی داشته باشند.
زبان شناساگر و API های مترجم در کروم روی دسکتاپ کار می کنند. این API ها روی دستگاه های تلفن همراه کار نمی کنند. Prompt API، Summarizer API، Writer API، Rewriter API، و Proofreader API در Chrome کار میکنند که شرایط زیر رعایت شود:
- سیستم عامل : ویندوز 10 یا 11؛ macOS 13+ (ونتورا و به بعد)؛ لینوکس؛ یا ChromeOS (از پلتفرم 16389.0.0 و به بعد) در دستگاههای Chromebook Plus . Chrome for Android، iOS و ChromeOS در دستگاههای غیرChromebook Plus هنوز توسط APIهایی که از Gemini Nano استفاده میکنند پشتیبانی نمیشوند.
- فضای ذخیره سازی : حداقل 22 گیگابایت فضای خالی در حجمی که نمایه Chrome شما را در بر می گیرد.
- GPU : به طور دقیق بیش از 4 گیگابایت VRAM.
- شبکه : داده های نامحدود یا اتصال نامحدود.
اندازه دقیق Gemini Nano ممکن است با بهروزرسانی مدل توسط مرورگر متفاوت باشد. برای تعیین اندازه فعلی، از chrome://on-device-internals
دیدن کنید.
چندین API داخلی در مراحل مختلف توسعه وجود دارد. برخی از آنها در Chrome stabil هستند، برخی از شرکتکنندگان در آزمایشهای اولیه موجود هستند، و برخی دیگر فقط برای شرکتکنندگان برنامه پیشنمایش اولیه در دسترس هستند.
هر API مجموعه ای از دستورالعمل های خود را برای شروع و دانلود مدل دارد، هم برای نمونه سازی محلی و هم در محیط های تولید با آزمایش های اولیه.
همه این APIها را می توان در هنگام ساخت برنامه های افزودنی کروم استفاده کرد.
APIها مانند مدلها در کروم تعبیه شدهاند. اولین باری که کاربر با این API ها تعامل می کند، مدل باید در مرورگر دانلود شود.
برای تعیین اینکه آیا یک API قابل استفاده و آماده است، تابع availability()
را فراخوانی کنید که یک وعده با یکی از مقادیر زیر را برمی گرداند:
-
"unavailable"
: دستگاه کاربر یا گزینه های جلسه درخواستی پشتیبانی نمی شود. دستگاه ممکن است قدرت یا فضای دیسک کافی نداشته باشد. -
"downloadable"
: برای ایجاد یک جلسه به دانلودهای بیشتری نیاز است که ممکن است شامل یک مدل متخصص، یک مدل زبان یا تنظیم دقیق باشد. ممکن است برای فراخوانیcreate()
فعالسازی کاربر لازم باشد. -
"downloading"
: دانلودها در حال انجام است و قبل از استفاده از یک جلسه باید کامل شوند. -
"available"
: می توانید بلافاصله یک جلسه ایجاد کنید.
اگر دستگاه میتواند از APIهای هوش مصنوعی داخلی پشتیبانی کند، اما مدل هنوز در دسترس نیست، برای شروع یک جلسه با create()
به تعامل کاربر نیاز است.
از ویژگی UserActivation.isActive
برای تأیید فعال سازی کاربر استفاده کنید، که می تواند یک کلیک، ضربه زدن یا فشار دادن کلید باشد.
// Check for user activation.
if (navigator.userActivation.isActive) {
// Create an instance of a built-in API
}
برای مثال با Summarizer API ، میتوانید از کاربران بخواهید با دکمهای که میگوید "Summarize" تعامل داشته باشند تا Summarizer.create()
فعال کند.
همه APIها در localhost
کروم در دسترس هستند.
- به
chrome://flags/#prompt-api-for-gemini-nano-multimodal-input
بروید. - Enabled را انتخاب کنید.
- روی راه اندازی مجدد یا راه اندازی مجدد کروم کلیک کنید.
برای تأیید اینکه Gemini Nano دانلود شده و طبق برنامه کار میکند، DevTools را باز کنید و await LanguageModel.availability();
به کنسول این باید available
باشد.
اگر مدل مطابق انتظار کار نمی کند، مراحل زیر را دنبال کنید:
- کروم را مجددا راه اندازی کنید.
- به
chrome://on-device-internals
بروید. - تب Model Status را انتخاب کنید و مطمئن شوید که هیچ خطایی وجود ندارد.
- DevTools را باز کنید و
LanguageModel.availability();
به کنسول این بایدavailable
باشد.
در صورت لزوم، مدتی صبر کنید و این مراحل را تکرار کنید.
ما در حال کار برای استانداردسازی این APIها هستیم تا در همه مرورگرها کار کنند. این بدان معناست که ما APIها را به جامعه پلتفرمهای وب پیشنهاد کردهایم، و آنها را برای بحث بیشتر به گروه جامعه انکوباتور وب W3C منتقل کردهایم.
ما از W3C، Mozilla و WebKit برای هر API درخواست بازخورد داریم.
اگر هوش مصنوعی داخلی را امتحان می کنید و بازخورد دارید، خوشحال می شویم آن را بشنویم.
- همه APIهای AI داخلی را کشف کنید.
- برای نگاهی اولیه به APIهای جدید و دسترسی به لیست پستی ما ، به برنامه پیش نمایش اولیه بپیوندید .
- اگر بازخوردی در مورد اجرای Chrome دارید، یک اشکال Chromium را ثبت کنید.
- با استانداردهای وب آشنا شوید.