تاريخ النشر: 12 ديسمبر 2024، تاريخ آخر تعديل: 20 مايو 2025
باستخدام واجهات برمجة تطبيقات الذكاء الاصطناعي المضمّنة، يمكن لتطبيق الويب تنفيذ مهام مستندة إلى الذكاء الاصطناعي بدون الحاجة إلى نشر نماذج الذكاء الاصطناعي الخاصة به أو إدارتها. نحن نعمل على توحيد هذه واجهات برمجة التطبيقات على جميع المتصفّحات.
المتطلبات
لاستخدام الذكاء الاصطناعي المضمَّن، يجب استيفاء متطلبات النموذج والأجهزة.
النماذج
تستخدم واجهتا برمجة التطبيقات Translator وLanguage Detector نماذج خبراء. تستخدم جميع واجهات برمجة التطبيقات الأخرى نموذجًا لغويًا مصمّمًا للعمل على أجهزة الكمبيوتر المكتبية والمحمولة.
تتيح واجهات برمجة التطبيقات Summarizer API وWriter API وRewriter API وProofreader API استخدام النص فقط. تتضمّن Prompt API إمكانات متعدّدة الوسائط.
Gemini Nano في Chrome
في Chrome، نموذج اللغة هو Gemini Nano. Gemini Nano غير متاح على الأجهزة الجوّالة.
بدءًا من الإصدار 140 من Chrome، يتيح Gemini Nano إدخال النصوص وإخراجها باللغات الإنجليزية والإسبانية واليابانية.
قبل استخدام واجهات برمجة التطبيقات المضمّنة للذكاء الاصطناعي، يجب الموافقة على سياسة الاستخدام المحظور للذكاء الاصطناعي التوليدي المتّبَعة في Google.
أجهزة
تتوفّر المتطلبات التالية للمطوّرين والمستخدمين الذين يشغّلون الميزات باستخدام واجهات برمجة التطبيقات هذه في Chrome. قد تتطلّب المتصفّحات الأخرى متطلبات تشغيل مختلفة.
تعمل واجهتا برمجة التطبيقات Language Detector وTranslator في متصفّح Chrome على الكمبيوتر. ولا تعمل واجهات برمجة التطبيقات هذه على الأجهزة الجوّالة. تعمل واجهات برمجة التطبيقات Prompt API وSummarizer API وWriter API وRewriter API وProofreader API في Chrome عند استيفاء الشروط التالية:
- نظام التشغيل: Windows 10 أو 11 أو macOS 13 (Ventura والإصدارات الأحدث) أو Linux أو ChromeOS (الإصدار 16389.0.0 والإصدارات الأحدث) على أجهزة Chromebook Plus لا تتوافق واجهات برمجة التطبيقات التي تستخدم Gemini Nano بعد مع Chrome على Android وiOS وChromeOS على الأجهزة غير Chromebook Plus.
- مساحة التخزين: يجب توفّر مساحة خالية لا تقل عن 22 غيغابايت على وحدة التخزين التي تحتوي على ملفك الشخصي على Chrome.
- وحدة معالجة الرسومات (GPU): يجب أن تكون ذاكرة الوصول العشوائي للفيديو (VRAM) أكبر من 4 غيغابايت.
- الشبكة: بيانات غير محدودة أو اتصال غير محدود.
قد يختلف حجم Gemini Nano الدقيق مع تحديث المتصفّح للنموذج. لمعرفة الحجم الحالي، انتقِل إلى chrome://on-device-internals
.
بدء التطوير
تتوفّر العديد من واجهات برمجة التطبيقات المضمّنة المستندة إلى الذكاء الاصطناعي في مراحل مختلفة من التطوير. بعضها متاح في إصدار Chrome الثابت، وبعضها الآخر متاح للمشاركين في التجارب الأصلية، وبعضها الآخر متاح فقط للمشاركين في "برنامج المعاينة المبكرة".
تتضمّن كل واجهة برمجة تطبيقات مجموعة التعليمات الخاصة بها لبدء استخدامها وتنزيل النموذج، سواء لإنشاء نماذج أولية محلية أو في بيئات الإنتاج باستخدام التجارب الأصلية.
- Translator API
- Language Detector API
- Summarizer API
- Writer API وRewriter API
- Proofreader API
- Prompt API
يمكن استخدام جميع واجهات برمجة التطبيقات هذه عند إنشاء إضافات Chrome.
تنزيل النموذج
تكون واجهات برمجة التطبيقات مضمَّنة في Chrome، وكذلك النماذج. في المرة الأولى التي يتفاعل فيها المستخدم مع واجهات برمجة التطبيقات هذه، يجب تنزيل النموذج إلى المتصفّح.
لتحديد ما إذا كانت واجهة برمجة التطبيقات قابلة للاستخدام وجاهزة، استدعِ الدالة غير المتزامنة availability()
، التي تعرض وعدًا يتضمّن إحدى القيم التالية:
-
"unavailable"
: لا يتوافق جهاز المستخدم أو خيارات الجلسة المطلوبة مع هذه الميزة. قد لا يتوفّر للجهاز طاقة أو مساحة تخزين كافية. "downloadable"
: يجب تنزيل ملفات إضافية لإنشاء جلسة، وقد يشمل ذلك نموذجًا خاصًا بالخبراء أو نموذجًا للغة أو عملية ضبط دقيق. قد يكون من الضروري تفعيل المستخدم لطلب الإجراءcreate()
."downloading"
: عمليات التنزيل قيد التقدّم ويجب إكمالها قبل أن تتمكّن من استخدام جلسة.-
"available"
: يمكنك إنشاء جلسة على الفور.
تفعيل حساب المستخدم
إذا كان الجهاز يتوافق مع واجهات برمجة التطبيقات المضمّنة للذكاء الاصطناعي، ولكن النموذج غير متاح بعد، يجب أن يتفاعل المستخدم مع الجهاز لبدء جلسة باستخدام create()
.
استخدِم السمة UserActivation.isActive
لتأكيد تفعيل أحد المستخدمين، والذي يمكن أن يكون نقرة أو لمسة أو ضغطة مفتاح.
// Check for user activation.
if (navigator.userActivation.isActive) {
// Create an instance of a built-in API
}
على سبيل المثال، باستخدام Summarizer API، يمكنك أن تطلب من المستخدمين التفاعل مع زرّ "تلخيص" لتفعيل Summarizer.create()
.
استخدام واجهات برمجة التطبيقات على المضيف المحلي
تتوفّر جميع واجهات برمجة التطبيقات على localhost
في Chrome.
- الانتقال إلى
chrome://flags/#prompt-api-for-gemini-nano-multimodal-input
- اختَر مفعّل.
- انقر على إعادة التشغيل أو أعِد تشغيل Chrome.
للتأكّد من أنّ Gemini Nano تم تنزيله ويعمل على النحو المطلوب، افتح DevTools واكتب await LanguageModel.availability();
في وحدة التحكّم. من المفترض أن تعرض هذه السمة available
.
تحديد المشاكل في localhost وحلّها
إذا لم يعمل النموذج على النحو المتوقّع، اتّبِع الخطوات التالية:
- أعِد تشغيل Chrome.
- الانتقال إلى
chrome://on-device-internals
- انقر على علامة التبويب حالة النموذج وتأكَّد من عدم وجود أي أخطاء.
- افتح "أدوات مطوّري البرامج" واكتب
LanguageModel.availability();
في وحدة التحكّم. من المفترض أن تعرض هذه السمة القيمةavailable
.
انتظِر بعض الوقت وكرِّر هذه الخطوات إذا لزم الأمر.
عملية وضع المعايير
نحن نعمل على توحيد هذه واجهات برمجة التطبيقات، لكي تعمل على جميع المتصفّحات. يعني هذا أنّنا اقترحنا واجهات برمجة التطبيقات على منتدى منصات الويب، ونقلناها إلى مجموعة W3C Web Incubator Community Group لمناقشتها بشكل أكبر.
نطلب الحصول على ملاحظات من W3C وMozilla وWebKit بشأن كل واجهة برمجة تطبيقات.
التفاعل مع الملاحظات ومشاركتها
إذا جرّبت الذكاء الاصطناعي المضمّن وكانت لديك ملاحظات، يسرّنا معرفتها.
- التعرّف على جميع واجهات برمجة التطبيقات المدمجة والمستنِدة إلى الذكاء الاصطناعي
- الانضمام إلى برنامج "الميزات التجريبية قبل إطلاقها" لإلقاء نظرة مبكرة على واجهات برمجة التطبيقات الجديدة والوصول إلى قائمتنا البريدية
- إذا كانت لديك ملاحظات حول طريقة تنفيذ Chrome لهذه الميزة، يُرجى إرسال تقرير عن خلل Chromium.
- مزيد من المعلومات عن معايير الويب