Gemini 3 Pro, Gemini 3 Pro Image (nano banana pro), and the latest Gemini Live API native audio models are now available to use with Firebase AI Logic on all platforms!

این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

با مدل های پشتیبانی شده آشنا شوید، درباره مدل های پشتیبانی شده بدانید، درباره مدل های پشتیبانی شده بدانید، درباره مدل های پشتیبانی شده بدانید

برای برنامه‌های موبایل و وب، کیت‌های توسعه نرم‌افزار Firebase AI Logic به شما امکان می‌دهند مستقیماً از طریق برنامه خود با مدل‌های Gemini و Imagen پشتیبانی‌شده تعامل داشته باشید.

مدل‌های Gemini چندوجهی در نظر گرفته می‌شوند زیرا قادر به پردازش و حتی تولید چندین حالت، از جمله متن، کد، PDF، تصاویر، ویدیو و صدا هستند. مدل‌های Imagen را می‌توان با متن برای تولید تصاویر تحریک کرد.

همچنین، سوالات متداول ما را در مورد تمام مدل‌هایی که Firebase AI Logic پشتیبانی می‌کند و پشتیبانی نمی‌کند، بررسی کنید.

مدل‌های عمومی

پرش به مقایسه مدل‌ها

باهوش‌ترین مدل ما

جمینی ۳ پرو

gemini-3-pro-preview

بهترین مدل ما برای درک چندوجهی، و قدرتمندترین مدل کدگذاری عاملی و ارتعاشی ما تاکنون، که تصاویر غنی‌تر و تعامل عمیق‌تری را ارائه می‌دهد، و همگی بر پایه استدلال پیشرفته ساخته شده‌اند. (ارائه صورتحساب الزامی است)

مدل تفکر پیشرفته ما

جمینی ۲.۵ پرو

gemini-2.5-pro

مدل تفکر پیشرفته ما، قادر به استدلال در مورد مسائل پیچیده در کد، ریاضی و STEM، و همچنین تجزیه و تحلیل مجموعه داده‌های بزرگ، پایگاه‌های کد و اسناد با استفاده از متن طولانی.

سریع و هوشمند

فلش جمینی ۲.۵

gemini-2.5-flash

بهترین مدل ما از نظر قیمت-عملکرد، با ارائه قابلیت‌های جامع. فلش ۲.۵ برای پردازش در مقیاس بزرگ، وظایف با تأخیر کم و حجم بالا که نیاز به تفکر دارند و موارد استفاده خودکار بهترین گزینه است.

فوق العاده سریع

جمینی ۲.۵ فلش-لایت

gemini-2.5-flash-lite

سریع‌ترین مدل فلش ما برای صرفه‌جویی در هزینه و توان عملیاتی بالا بهینه شده است.

مدل‌های تولید تصویر

شما می‌توانید تصاویر را با مدل‌های Gemini یا Imagen تولید کنید.

پرش به مقایسه مدل‌ها

جوزا

تصویر Gemini 3 Pro (معروف به نانو موز پرو )

gemini-3-pro-image-preview

طراحی شده برای تولید حرفه‌ای دارایی‌ها و دستورالعمل‌های پیچیده. این نرم‌افزار با استفاده از جستجوی گوگل، یک فرآیند پیش‌فرض «تفکر» که ترکیب‌بندی را قبل از تولید اصلاح می‌کند، زمینه‌سازی در دنیای واقعی را ارائه می‌دهد و می‌تواند تصاویری با وضوح حداکثر 4K تولید کند. (نیازمند پرداخت صورتحساب)

ایمیج فلش Gemini 2.5 (معروف به نانو موز )

gemini-2.5-flash-image

طراحی شده برای سرعت و کارایی. برای کارهای با حجم بالا و تأخیر کم بهینه شده و تصاویر را با وضوح 1024 پیکسل تولید می‌کند. (نیاز به پرداخت صورتحساب)

ایمیجِن

تصویر ۴

imagen-4.0-generate-001

تصاویر واقعی و با کیفیت بالا را از متن‌های زبان طبیعی تولید می‌کند. (نیاز به پرداخت هزینه دارد)

ایمجین ۴ سریع

imagen-4.0-fast-generate-001

تصاویر را برای نمونه‌سازی اولیه یا موارد استفاده با تأخیر کم تولید می‌کند. (نیاز به پرداخت صورتحساب)

ایمیجن ۴ اولترا

imagen-4.0-ultra-generate-001

تصاویر واقعی و با کیفیت بالا را از متن‌های زبان طبیعی تولید می‌کند. (نیاز به پرداخت هزینه دارد)

مدل‌های تولید صدا

شما می‌توانید با مدل‌هایی که از Gemini Live API پشتیبانی می‌کنند، صدای استریم شده تولید کنید.

پرش به مقایسه مدل‌ها

فلش Gemini 2.5 با صدای بومی Gemini Live API

رابط برنامه‌نویسی کاربردی توسعه‌دهندگان Gemini: gemini-2.5-flash-native-audio-preview-12-2025

رابط برنامه‌نویسی کاربردی Vertex AI Gemini: gemini-live-2.5-flash-native-audio

تعاملات صوتی و تصویری با تأخیر کم و بلادرنگ را با مدل Gemini که دو طرفه است، امکان‌پذیر می‌کند.

مدل‌های نسل قبلی

مدل‌های زیر فعال هستند، اما از نسل قبلی می‌باشند. توصیه می‌کنیم در صورت امکان از جدیدترین مدل‌ها استفاده کنید.

پرش به مقایسه مدل‌ها

مدل‌های جمینی

مدل نسل دوم و کارآمد ما

فلش جمینی ۲.۰

gemini-2.0-flash-001

مدل نسل دوم و قدرتمند ما، با پنجره‌ی زمینه‌ی ۱ میلیون توکن. ویژگی‌های نسل بعدی و قابلیت‌های بهبود یافته، از جمله سرعت برتر و استفاده از ابزار بومی را ارائه می‌دهد.

مدل سریع نسل دوم ما

جمینی ۲.۰ فلش-لایت

gemini-2.0-flash-lite-001

مدل کوچک و کارآمد نسل دوم ما، با پنجره زمینه ۱ میلیون توکن. بهینه شده برای بهره‌وری هزینه و تأخیر کم.

ادامه‌ی این صفحه اطلاعات دقیقی در مورد مدل‌های پشتیبانی‌شده توسط Firebase AI Logic ارائه می‌دهد.

مقایسه مدل‌ها :
- ورودی و خروجی پشتیبانی شده
- مقایسه سطح بالا از قابلیت‌های پشتیبانی‌شده
- مشخصات و محدودیت‌ها، برای مثال حداکثر توکن‌های ورودی یا حداکثر طول ویدیوی ورودی
شرح نحوه‌ی نسخه‌بندی مدل‌ها ، به ویژه نسخه‌های پایدار ، به‌روزرسانی خودکار ، پیش‌نمایش و آزمایشی آنها
فهرست نام مدل‌های موجود برای گنجاندن در کد شما در هنگام مقداردهی اولیه
لیست زبان‌های پشتیبانی‌شده برای مدل‌ها

در پایین این صفحه، می‌توانید اطلاعات دقیقی در مورد مدل‌های نسل قبلی مشاهده کنید .

مقایسه مدل‌ها

هر مدل قابلیت‌های متفاوتی برای پشتیبانی از موارد استفاده مختلف دارد. توجه داشته باشید که هر یک از جداول این بخش، هر مدل را هنگام استفاده با Firebase AI Logic شرح می‌دهند. هر مدل ممکن است قابلیت‌های اضافی داشته باشد که هنگام استفاده از SDK های ما در دسترس نیستند.

اگر اطلاعات مورد نظر خود را در زیربخش‌های زیر پیدا نکردید، می‌توانید اطلاعات بیشتری را در مستندات ارائه‌دهنده API انتخابی خود بیابید:

رابط برنامه‌نویسی کاربردی توسعه‌دهندگان Gemini : مدل‌های Gemini و مدل‌های Imagen
Vertex AI Gemini API : مدل‌های Gemini و مدل‌های Imagen

ورودی و خروجی پشتیبانی شده

اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Firebase AI Logic هستند:

	جوزا ۳ پرو	جوزا ۳ پرو تصویر	جوزا ۲.۵ پرو، فلش، فلش-لایت	جوزا ۲.۵ فلش تصویر	جوزا ۲.۵ فلش- زنده *******	تصویر (تولید)	تصویر (قابلیت)
انواع ورودی
متن					(پخش جریانی)
کد
اسناد (پی‌دی‌اف یا متن ساده)
تصاویر
ویدئو					(پخش جریانی)
صوتی					(پخش جریانی)
انواع خروجی
متن
متن (پخش)					(رونویسی)
کد
خروجی ساختاریافته (مثل جیسون)
تصاویر
صوتی					(پخش جریانی)

برای آشنایی با انواع فایل‌های پشتیبانی‌شده، به بخش فایل‌های ورودی پشتیبانی‌شده و الزامات مراجعه کنید.

قابلیت‌ها و ویژگی‌های پشتیبانی‌شده

این قابلیت‌ها و ویژگی‌های پشتیبانی‌شده هنگام استفاده از هر مدل با Firebase AI Logic هستند:

	جوزا ۳ پرو تصویر	جوزا ۲.۵ فلش تصویر	جوزا ۲.۵ فلش- زنده *******
تفکر
تولید متن از ورودی‌های فقط متنی یا چندوجهی	به صورت لایه لایه یا به عنوان بخشی از تصویر	به صورت لایه لایه یا به عنوان بخشی از تصویر	فقط رونویسی
تولید تصاویر ( جوزا یا ایمیجن )
ویرایش تصاویر ( جوزا یا ایمیجن )
تولید صدا			فقط پخش جریانی
تولید خروجی ساختاریافته (مثل جیسون)
اسناد را تجزیه و تحلیل کنید (پی‌دی‌اف یا متن ساده)
تحلیل تصاویر (بینایی)
تجزیه و تحلیل ویدیو (بینایی)			فقط پخش جریانی
تجزیه و تحلیل صدا			فقط پخش جریانی
چت چند نوبتی			فقط پخش جریانی
جریان‌سازی چندوجهی دوطرفه
فراخوانی تابع
اجرای کد
اتصال به زمین با جستجوی گوگل
دستورالعمل‌های سیستم
تعداد توکن‌ها

مشخصات و محدودیت‌ها

مشخصات و محدودیت‌های استفاده از هر مدل با Firebase AI Logic به شرح زیر است:

ملک	جوزا ۳ پرو	جوزا ۳ پرو تصویر	جوزا ۲.۵ پرو، فلش، فلش-لایت	جوزا ۲.۵ فلش تصویر	جوزا ۲.۵ فلش- زنده *******	تصویر (تولید)	تصویر (قابلیت)
محدودیت توکن ورودی *	۱,۰۴۸,۵۷۶ توکن	۶۵,۵۳۶ توکن	۱,۰۴۸,۵۷۶ توکن	۳۲۷۶۸ توکن	۳۲ هزار توکن (پیش‌فرض؛ قابل ارتقا به ۱۲۸ هزار)	۴۸۰ توکن	۴۸۰ توکن
محدودیت توکن خروجی *	۶۵,۵۳۶ توکن	۳۲۷۶۸ توکن	۶۵,۵۳۶ توکن	۸,۱۹۲ توکن	۶۴ هزار توکن	---	---
تاریخ پایان دانش	ژانویه ۲۰۲۵	ژانویه ۲۰۲۵	ژانویه ۲۰۲۵	ژوئن ۲۰۲۵	ژانویه ۲۰۲۵	---	---
فایل‌های PDF (بنا به درخواست)
حداکثر تعداد از فایل‌های PDF ورودی **	۹۰۰ فایل	۱۴ فایل	۳۰۰۰ فایل	۳ فایل	---	---	---
حداکثر تعداد از صفحات به ازای هر فایل PDF ورودی **	۹۰۰ صفحه	۱۴ صفحه	۱۰۰۰ صفحه	۳ صفحه	---	---	---
حداکثر اندازه به ازای هر فایل PDF ورودی	۵۰ مگابایت	۵۰ مگابایت	۵۰ مگابایت	۵۰ مگابایت	---	---	---
تصاویر (بنا به درخواست)
حداکثر تعداد از تصاویر ورودی	۱۰۰۰ تصویر	۱۴ تصویر	۳۰۰۰ تصویر	۳ تصویر	---	---	۴ تصویر
حداکثر تعداد از تصاویر خروجی	---	۱۰ تصویر	---	۱۰ تصویر	---	۴ تصویر	۴ تصویر
حداکثر اندازه تصویر کدگذاری شده با base64 به ازای هر ورودی	۷ مگابایت	۷ مگابایت	۷ مگابایت	۷ مگابایت	---	---	---
ویدئو (به درخواست)
حداکثر تعداد از فایل‌های ویدیویی ورودی	۱۰ فایل	---	۱۰ فایل	---	---	---	---
حداکثر طول از تمام ویدیوهای ورودی (فقط قاب‌ها)	حدود ۶۰ دقیقه	---	حدود ۶۰ دقیقه	---	---	---	---
حداکثر طول از تمام ویدیوهای ورودی (فریم‌ها + صدا)	حدود ۴۵ دقیقه	---	حدود ۴۵ دقیقه	---	---	---	---
صدا (به درخواست)
حداکثر تعداد از فایل‌های صوتی ورودی	۱ فایل	---	۱ فایل	---	---	---	---
حداکثر تعداد از فایل‌های صوتی خروجی	---	---	---	---	---	---	---
حداکثر طول از تمام صداهای ورودی	حدود ۸.۴ ساعت	---	حدود ۸.۴ ساعت	---	---	---	---
حداکثر طول از تمام صداهای خروجی	---	---	---	---	---	---	---

^{* برای همه مدل‌های Gemini ، یک توکن معادل حدود ۴ کاراکتر است، بنابراین ۱۰۰ توکن حدود ۶۰ تا ۸۰ کلمه انگلیسی است. برای مدل‌های Gemini ، می‌توانید تعداد کل توکن‌ها را در درخواست‌های خود با استفاده countTokens تعیین کنید.}

^{** فایل‌های PDF به عنوان تصویر در نظر گرفته می‌شوند، بنابراین یک صفحه از PDF به عنوان یک تصویر در نظر گرفته می‌شود. تعداد صفحات مجاز در یک درخواست محدود به تعداد تصاویری است که مدل می‌تواند پشتیبانی کند.}

^{*** مدل‌های Gemini 2.5 Flash-Live مدل‌های صوتی بومی هستند که از Gemini Live API پشتیبانی می‌کنند.}

اطلاعات دقیق اضافی را پیدا کنید

سهمیه‌ها و قیمت‌گذاری برای هر مدل متفاوت است. قیمت‌گذاری همچنین به ورودی و خروجی بستگی دارد.
در مورد انواع فایل‌های ورودی پشتیبانی‌شده، نحوه تعیین نوع MIME و نحوه اطمینان از اینکه فایل‌های ورودی و درخواست‌های چندوجهی شما الزامات را برآورده می‌کنند و از بهترین شیوه‌ها در فایل‌ها و الزامات ورودی پشتیبانی‌شده پیروی می‌کنند، اطلاعات کسب کنید.
مهم : محدودیت حجم کل درخواست ۲۰ مگابایت است. برای ارسال فایل‌های بزرگ، گزینه‌های ارائه فایل‌ها در درخواست‌های چندوجهی را بررسی کنید.

الگوهای نسخه‌بندی و نامگذاری مدل

مدل‌ها در نسخه‌های پایدار ، پیش‌نمایش و آزمایشی ارائه می‌شوند. برای راحتی، از نام‌های مستعار بدون مقادیر نسخه صریح پشتیبانی می‌شود.

برای یافتن نام‌های مدل خاص برای استفاده در کد خود، به بخش «نام‌های مدل موجود» در ادامه همین صفحه مراجعه کنید.

نوع نسخه / مرحله انتشار		توضیحات	الگوی نام مدل
پایدار		نسخه‌های *پایدار* از تاریخ انتشار برای استفاده در محیط عملیاتی در دسترس و پشتیبانی می‌شوند. یک نسخه پایدار از مدل معمولاً با یک تاریخ انقضا منتشر می‌شود که نشان‌دهنده آخرین روزی است که مدل در دسترس است. پس از این تاریخ، مدل دیگر توسط گوگل قابل دسترسی یا پشتیبانی نیست.	مدل‌های جمینی ۲.۵ نام مدل‌های نسخه‌های پایدار پسوند ندارند مثال: `gemini-2.5-pro` مدل‌های Gemini 2.0 و Imagen نام مدل‌های نسخه‌های پایدار با یک شماره نسخه سه رقمی خاص ضمیمه می‌شوند مثال: `gemini-2.0-flash-001` مثال: `imagen-3.0-generate-002`
	نام مستعار پایدار با به‌روزرسانی خودکار (فقط مدل‌های Gemini 2.0 )	نام‌های مستعار پایدار *که به صورت خودکار به‌روزرسانی می‌شوند،* همیشه به آخرین نسخه پایدار آن مدل اشاره می‌کنند. اگر نسخه پایدار جدیدی منتشر شود، نام مستعار به‌روزرسانی‌شده خودکار به‌طور خودکار شروع به اشاره به آن نسخه پایدار جدید می‌کند.	فقط مدل‌های Gemini 2.0 نام‌های مدلِ مستعار پسوند ندارند مثال: `gemini-2.0-flash`
پیش‌نمایش		نسخه‌های *پیش‌نمایش* دارای قابلیت‌های جدیدی هستند و پایدار محسوب نمی‌شوند . این مدل‌ها برای استفاده در تولید توصیه نمی‌شوند ، محدودیت‌های نرخ محدودتری دارند و ممکن است الزامات صورتحساب داشته باشند. این مدل‌ها ظرف چند هفته یا چند ماه پس از انتشار نسخه پایدار مرتبط با آنها، از رده خارج می‌شوند. برای رابط برنامه‌نویسی کاربردی Vertex AI Gemini ، مدل‌های پیش‌نمایش منتشر شده پس از ژوئن ۲۰۲۵ معمولاً از شما می‌خواهند که موقعیت مکانی مدل را روی `global` تنظیم کنید .	نام مدل‌های نسخه‌های پیش‌نمایش به همراه ... پیوست شده‌اند. `-preview` و اغلب تاریخ انتشار مدل ( `-MM-DD` برای مدل‌های قدیمی‌تر یا (برای مدل‌های جدیدتر `-MM-YYYY` ) مثال‌ها: `gemini-2.5-flash-preview-04-17` (منتشر شده در ۱۷ آوریل ۲۰۲۵) یا `gemini-2.5-flash-preview-09-2025` (منتشر شده در سپتامبر ۲۰۲۵) یا `gemini-3-pro-preview` (منتشر شده در نوامبر ۲۰۲۵)
تجربی		نسخه‌های *آزمایشی* قابلیت‌های جدیدی دارند و پایدار تلقی نمی‌شوند . این مدل‌ها برای استفاده در محیط تولید توصیه نمی‌شوند و محدودیت‌های نرخ بیشتری دارند. مدل‌های آزمایشی برای جمع‌آوری بازخورد و امکان آزمایش با جدیدترین ویژگی‌های ما در نظر گرفته شده‌اند. این مدل‌ها ظرف چند هفته یا چند ماه پس از انتشار نسخه پایدار مرتبط با آنها، از رده خارج می‌شوند. برای رابط برنامه‌نویسی کاربردی Vertex AI Gemini ، مدل‌های آزمایشی که پس از ژوئن ۲۰۲۵ منتشر شده‌اند، شما را ملزم می‌کنند که موقعیت مکانی مدل را روی `global` تنظیم کنید .	نام مدل‌های نسخه‌های آزمایشی به همراه ... پیوست شده است. `-exp` به همراه تاریخ انتشار مدل ( `-MM-DD` ) مثال: `gemini-2.5-pro-exp-03-25` (منتشر شده در ۲۵ مارس ۲۰۲۵)
بازنشسته		نسخه‌های *از رده خارج شده،* تاریخ انقضایشان گذشته و برای همیشه غیرفعال شده‌اند. مدل‌های منسوخ‌شده دیگر توسط گوگل قابل دسترسی یا پشتیبانی نیستند و درخواستی که از نام مدل منسوخ‌شده استفاده می‌کند، خطای ۴۰۴ را برمی‌گرداند.	---

برای موارد استفاده در محیط عملیاتی، توصیه می‌کنیم از نام مدل صریح برای جدیدترین نسخه پایدار استفاده کنید. اگرچه یک نام مستعار پایدار که به صورت خودکار به‌روزرسانی می‌شود به یک نسخه پایدار اشاره می‌کند، نسخه مدل واقعی که به آن اشاره می‌کند، هر زمان که نسخه پایدار جدیدی منتشر شود، به طور خودکار تغییر می‌کند، که می‌تواند به معنای رفتار یا پاسخ‌های غیرمنتظره باشد.

نسخه‌های پیش‌نمایش و آزمایشی فقط در طول نمونه‌سازی اولیه توصیه می‌شوند.

ما همچنین استفاده از Firebase Remote Config توصیه می‌کنیم تا بتوانید مدل و نسخه برنامه خود را به صورت پویا و بدون انتشار نسخه جدید برنامه خود تغییر دهید .

نام مدل‌های موجود

نام‌های مدل، مقادیر صریحی هستند که شما در هنگام مقداردهی اولیه مدل، در کد خود قرار می‌دهید.

پرش به نام مدل‌های پرش به نام مدل‌های Imagen

لیست کردن تمام مدل‌های موجود به صورت برنامه‌نویسی شده

شما می‌توانید با استفاده از REST API، نام تمام مدل‌های موجود را فهرست کنید:

رابط برنامه‌نویسی کاربردی توسعه‌دهندگان Gemini : فراخوانی نقطه پایانی models.list
رابط برنامه‌نویسی کاربردی Vertex AI Gemini : فراخوانی نقطه پایانی publishers.models.list

توجه داشته باشید که این لیست برگشتی شامل تمام مدل‌های پشتیبانی‌شده توسط ارائه‌دهندگان API خواهد بود، اما Firebase AI Logic فقط از مدل‌های Gemini و Imagen که در این صفحه توضیح داده شده‌اند، پشتیبانی می‌کند. همچنین توجه داشته باشید که نام‌های مستعار به‌روزرسانی‌شده خودکار (به عنوان مثال، gemini-2.0-flash ) در فهرست قرار نگرفته‌اند زیرا آنها یک نام مستعار برای مدل پایه هستند.

نام مدل‌های جمینی

برای مثال‌های مقداردهی اولیه برای پلتفرم خود، به راهنمای شروع به کار مراجعه کنید.

برای جزئیات بیشتر در مورد مراحل انتشار (به ویژه برای موارد استفاده، صدور صورتحساب و بازنشستگی)، به الگوهای نسخه‌بندی و نامگذاری مدل مراجعه کنید.

مهم : نام مدل‌های پایدار Gemini 2.5 پسوند سه رقمی ندارند و نام مستعار آنها به صورت خودکار به‌روزرسانی نمی‌شود .

همچنین، اگر از Vertex AI Gemini API استفاده می‌کنید، تمام مدل‌های پیش‌نمایش Gemini 3 و Gemini 2.5 (به جز مدل‌های Gemini Live API ) که پس از ژوئن ۲۰۲۵ منتشر می‌شوند، فقط در نسخه global در دسترس هستند.

نام مدل‌های جمینی ۳ پرو

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-3-pro-preview`	نسخه پیش‌نمایش Gemini 3 Pro	پیش‌نمایش	۲۰۲۵-۱۱-۱۸	تعیین خواهد شد

نام مدل‌های Gemini 3 Pro Image (معروف به "nano banana pro")

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-3-pro-image-preview`	نسخه پیش‌نمایش تصویر Gemini 3 Pro (معروف به "نانو موز پرو")	پیش‌نمایش	۲۰۲۵-۱۱-۲۰	تعیین خواهد شد

نام مدل‌های Gemini 2.5 Pro

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-2.5-pro`	نسخه پایدار Gemini 2.5 Pro	پایدار	۲۰۲۵-۰۶-۱۷	نه زودتر از ۲۰۲۶-۰۶-۱۷

نام مدل‌های Gemini 2.5 Flash

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-2.5-flash`	نسخه پایدار Gemini 2.5 Flash	پایدار	۲۰۲۵-۰۶-۱۷	نه زودتر از ۲۰۲۶-۰۶-۱۷

نام مدل‌های Gemini 2.5 Flash‑Lite

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-2.5-flash-lite`	نسخه پایدار Gemini 2.5 Flash‑Lite	پایدار	۲۰۲۵-۰۷-۲۲	نه زودتر از ۲۰۲۶-۰۷-۲۲

نام مدل‌های تصویر فلش Gemini 2.5 (معروف به "نانو موز")

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-2.5-flash-image`	نسخه پایدار برای Gemini 2.5 Flash Image (معروف به "نانو موز")	پایدار	۲۰۲۵-۱۰-۰۲	نه زودتر از ۲۰۲۶-۱۰-۰۲

نام مدل‌های Gemini 2.5 Flash Live

مدل‌های Gemini 2.5 Flash Live مدل‌های صوتی بومی هستند که از Gemini Live API پشتیبانی می‌کنند. اگرچه این مدل بسته به ارائه‌دهنده Gemini API نام‌های مختلفی دارد، اما رفتار و ویژگی‌های مدل یکسان است.

رابط برنامه‌نویسی کاربردی (API) توسعه‌دهندگان جمینی نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-2.5-flash-native-audio-preview-12-2025` ^۱	آخرین نسخه پیش‌نمایش برای Live API در Gemini Developer API	پیش‌نمایش	۲۰۲۵-۱۲-۱۲	تعیین خواهد شد
`gemini-2.5-flash-native-audio-preview-09-2025` ^۱	نسخه پیش‌نمایش اولیه برای Live API در Gemini Developer API	پیش‌نمایش	۲۰۲۵-۰۹-۱۸	تعیین خواهد شد

Vertex AI Gemini API نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-live-2.5-flash-native-audio` ^{شده‌اند}	نسخه پایدار برای Live API روی API Vertex AI Gemini	پایدار	۲۰۲۵-۱۲-۱۲	نه زودتر از ۲۰۲۶-۱۲-۱۲
`gemini-live-2.5-flash-preview-native-audio-09-2025` ²	نسخه پیش‌نمایش برای Live API در Vertex AI Gemini API	پیش‌نمایش	۲۰۲۵-۰۹-۱۸	تعیین خواهد شد

^{۱ فقط توسط رابط برنامه‌نویسی نرم‌افزار Gemini Developer پشتیبانی می‌شود. همچنین، اگرچه اینها مدل‌های پیش‌نمایش هستند، اما در «ردیف رایگان» رابط برنامه‌نویسی نرم‌افزار Gemini Developer در دسترس هستند.}
^{۲ فقط توسط Vertex AI Gemini API پشتیبانی می‌شود. همچنین، این مدل‌ها در موقعیت global پشتیبانی نمی‌شوند.}

نام مدل‌های ایمیجن

برای مثال‌های مقداردهی اولیه برای پلتفرم خود، به راهنمای تولید تصاویر با Imagen مراجعه کنید.

نام مدل‌های ایمیجن ۴

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`imagen-4.0-generate-001`	نسخه پایدار Imagen 4	پایدار	۱۴-۰۸-۲۰۲۵	زودتر از 2026-08-14 مجاز نیست

نام مدل‌های Imagen 4 Fast

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`imagen-4.0-fast-generate-001`	نسخه پایدار Imagen 4 Fast	پایدار	۱۴-۰۸-۲۰۲۵	زودتر از 2026-08-14 مجاز نیست

نام مدل‌های ایمیجن ۴ اولترا

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`imagen-4.0-ultra-generate-001`	نسخه پایدار Imagen 4 Ultra	پایدار	۱۴-۰۸-۲۰۲۵	زودتر از 2026-08-14 مجاز نیست

نام مدل‌های قابلیت Imagen 3

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`imagen-3.0-capability-001` ²	نسخه پایدار اولیه قابلیت Imagen 3	پایدار	۲۰۲۴-۱۲-۱۰	زودتر از 2025-12-10

^{۲- صرف نظر از نحوه دسترسی شما، توسط رابط برنامه‌نویسی کاربردی توسعه‌دهندگان Gemini پشتیبانی نمی‌شود.}

زبان‌های پشتیبانی‌شده جوزا

تمام مدل‌های Gemini می‌توانند زبان‌های زیر را درک کرده و به آنها پاسخ دهند:
عربی (ar)، بنگالی (bn)، بلغاری (bg)، چینی ساده‌شده و سنتی (zh)، کرواتی (hr)، چکی (cs)، دانمارکی (da)، هلندی (nl)، انگلیسی (en)، استونیایی (et)، فنلاندی (fi)، فرانسوی (fr)، آلمانی (de)، یونانی (el)، عبری (iw)، هندی (hi)، مجارستانی (hu)، اندونزیایی (id)، ایتالیایی (it)، ژاپنی (ja)، کره‌ای (ko)، لتونیایی (lv)، لیتوانیایی (lt)، نروژی (no)، لهستانی (pl)، پرتغالی (pt)، رومانیایی (ro)، روسی (ru)، صربی (sr)، اسلواکی (sk)، اسلوونیایی (sl)، اسپانیایی (es)، سواحیلی (sw)، سوئدی (sv)، تایلندی (th)، ترکی (tr)، اوکراینی (uk)، ویتنامی (vi)
مدل‌های Gemini 2.0 Flash ، Gemini 1.5 Pro و Gemini 1.5 Flash می‌توانند زبان‌های اضافی زیر را درک کرده و به آنها پاسخ دهند:
آفریکانس (af)، آمهری (am)، آسامی (ع)، آذربایجانی (az)، بلاروسی (be)، بوسنیایی (bs)، کاتالان (ca)، سبوانو (ceb)، کورسی (co)، ولزی (cy)، Dhivehi (dv)، اسپرانتو (eo)، باسک (eu)، فارسی (fa)، فیلیپینی (تاگالوگ) (fil)، (fy)، ایرلندی (ga)، گالیکایی اسکاتلندی (ga)، گالیکایی گالاتی (ga)، اسکاتلندی (ga) (ha)، هاوایی (haw)، همونگ (hmn)، کریول هائیتی (ht)، ارمنی (hy)، ایگبو (ig)، ایسلندی (is)، جاوه ای (jv)، گرجی (ka)، قزاقستان (kk)، خمر (km)، کانادا (kn)، کریو (kri)، کردی (ku)، قرقیز (ky)، لاتین (la)، لوگزامبورگی (lb)، لائوس (lom)، مقدونی، مالاگاسی (mk)، مالایالام (ml)، مغولی (mn)، Meiteilon (Manipuri) (mni-Mtei)، مراتی (mr)، مالایی (ms)، مالتی (mt)، میانمار (برمه) (my)، نپالی (ne)، Nyanja (Chichewa) (ny)، Odia (Oriya) (یا)، پنجابی (Pa), Pashtoinhales (Pashto) (si)، ساموآیی (sm)، شونا (sn)، سومالیایی (so)، آلبانیایی (sq)، سسوتو (st)، سوندانی (su)، تامیلی (ta)، تلوگو (te)، تاجیکی (tg)، اویغور (ug)، اردو (ur)، ازبکی (uz)، Xhosa (xh)، ییدیش (yi)، یروبا (yo)، زولو (zu)

ایمیجِن

دسترسی عمومی : انگلیسی
پیش‌نمایش : چینی (ساده‌شده)، چینی (سنتی)، هندی، ژاپنی، کره‌ای، پرتغالی، اسپانیایی

اطلاعات مربوط به مدل‌های قبلی

مدل‌های جمینی

gemini-2.0-flash-001 (و نام مستعار به‌روزرسانی‌شده خودکار آن gemini-2.0-flash )
gemini-2.0-flash-lite-001 (و نام مستعار به‌روزرسانی‌شده خودکار آن gemini-2.0-flash-lite )

برای اطلاعات بیشتر در مورد مدل‌های قدیمی‌تر Gemini Live API ، به مستندات ارائه‌دهنده Gemini API مراجعه کنید:

مدل‌های ایمیجن

imagen-3.0-generate-002
imagen-3.0-fast-generate-001

تمام مدل‌های Gemini 1.0 و Gemini 1.5 از رده خارج شده‌اند و تمام درخواست‌ها به این مدل‌ها خطای ۴۰۴ را برمی‌گردانند. برای جلوگیری از اختلال در سرویس، به مدل جدیدتری (مثلاً gemini-2.5-flash-lite ) به‌روزرسانی کنید. اطلاعات بیشتر.

وقتی که به طور جدی شروع به توسعه برنامه خود می‌کنید، توصیه می‌کنیم از Firebase Remote Config استفاده کنید تا بتوانید از راه دور مدل و نسخه برنامه خود را بدون انتشار نسخه جدید برنامه تغییر دهید .

مشاهده ورودی و خروجی پشتیبانی شده از مدل‌های نسل قبلی

اینها انواع ورودی و خروجی هنگام استفاده از هر مدل با Firebase AI Logic هستند:

	جوزا فلش ۲.۰	جوزا فلش ۲.۰ لایت
انواع ورودی
متن
متن (پخش)
کد
اسناد (پی‌دی‌اف یا متن ساده)
تصاویر
ویدئو
صوتی
صدا (پخش جریانی)
انواع خروجی
متن
متن (پخش)
کد
خروجی ساختاریافته (مثل جیسون)
تصاویر
صوتی
صدا (پخش جریانی)

قابلیت‌ها و ویژگی‌های پشتیبانی‌شده از مدل‌های نسل قبلی

این قابلیت‌ها و ویژگی‌ها هنگام استفاده از هر مدل با Firebase AI Logic وجود دارد:

	جوزا فلش ۲.۰	جوزا فلش ۲.۰ لایت
تفکر
تولید متن از ورودی‌های فقط متنی یا چندوجهی
تولید تصاویر ( جوزا یا ایمیجن )
ویرایش تصاویر ( جوزا یا ایمیجن )
تولید صدا
تولید خروجی ساختاریافته (مثل جیسون)
اسناد را تجزیه و تحلیل کنید (پی‌دی‌اف یا متن ساده)
تحلیل تصاویر (بینایی)
تجزیه و تحلیل ویدیو (بینایی)
تجزیه و تحلیل صدا
چت چند نوبتی
جریان‌سازی چندوجهی دوطرفه
فراخوانی تابع
اجرای کد
اتصال به زمین با جستجوی گوگل
دستورالعمل‌های سیستم
تعداد توکن‌ها

مشخصات و محدودیت‌های مدل‌های نسل قبلی

مشخصات و محدودیت‌های استفاده از هر مدل با Firebase AI Logic به شرح زیر است:

ملک	جوزا فلش ۲.۰	جوزا فلش ۲.۰ لایت
پنجره زمینه * محدودیت کل توکن (ورودی + خروجی ترکیبی)	۱,۰۴۸,۵۷۶ توکن	۱,۰۴۸,۵۷۶ توکن
محدودیت توکن خروجی *	۸,۱۹۲ توکن	۸,۱۹۲ توکن
تاریخ پایان دانش	ژوئن ۲۰۲۴	ژوئن ۲۰۲۴
فایل‌های PDF (بنا به درخواست)
حداکثر تعداد از فایل‌های PDF ورودی **	۳۰۰۰ فایل	۳۰۰۰ فایل
حداکثر تعداد از صفحات به ازای هر فایل PDF ورودی **	۱۰۰۰ صفحه	۱۰۰۰ صفحه
حداکثر اندازه به ازای هر فایل PDF ورودی	۵۰ مگابایت	۵۰ مگابایت
تصاویر (بنا به درخواست)
حداکثر تعداد از تصاویر ورودی	۳۰۰۰ تصویر	۳۰۰۰ تصویر
حداکثر تعداد از تصاویر خروجی	---	---
حداکثر اندازه تصویر کدگذاری شده با base64 به ازای هر ورودی	۷ مگابایت	۷ مگابایت
ویدئو (به درخواست)
حداکثر تعداد از فایل‌های ویدیویی ورودی	۱۰ فایل	۱۰ فایل
حداکثر طول از تمام ویدیوهای ورودی (فقط قاب‌ها)	حدود ۶۰ دقیقه	حدود ۶۰ دقیقه
حداکثر طول از تمام ویدیوهای ورودی (فریم‌ها + صدا)	حدود ۴۵ دقیقه	حدود ۴۵ دقیقه
صدا (به درخواست)
حداکثر تعداد از فایل‌های صوتی ورودی	۱ فایل	۱ فایل
حداکثر تعداد از فایل‌های صوتی خروجی	---	---
حداکثر طول از تمام صداهای ورودی	حدود ۸.۴ ساعت	حدود ۸.۴ ساعت
حداکثر طول از تمام صداهای خروجی	---	---

نام مدل‌های موجود از مدل‌های نسل قبلی (شامل تاریخ‌های بازنشستگی)

نام‌های مدل، مقادیر صریحی هستند که شما در هنگام مقداردهی اولیه مدل، در کد خود قرار می‌دهید.

مدل‌های جمینی نام مدل‌های Gemini 2.0 Flash

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-2.0-flash-001`	آخرین نسخه پایدار Gemini 2.0 Flash	پایدار	۲۰۲۵-۰۲-۰۵	نه زودتر از ۲۰۲۶-۰۲-۰۵
`gemini-2.0-flash`	نام مستعار به‌روزرسانی‌شده خودکار که به آخرین نسخه پایدار Gemini 2.0 Flash اشاره دارد (در حال حاضر `gemini-2.0-flash-001` )	پایدار	۲۰۲۵-۰۲-۱۰	---

نام مدل‌های Gemini 2.0 Flash‑Lite

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`gemini-2.0-flash-lite-001`	آخرین نسخه پایدار Gemini 2.0 Flash‑Lite	پایدار	2025-02-25	نه زودتر از ۲۰۲۶-۰۲-۲۵
`gemini-2.0-flash-lite`	نام مستعار به‌روزرسانی‌شده خودکار که به آخرین نسخه پایدار Gemini 2.0 Flash‑Lite اشاره دارد (در حال حاضر `gemini-2.0-flash-lite-001` )	پایدار	2025-02-25	---

مدل‌های ایمیجن نام مدل‌های ایمیجن ۳

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`imagen-3.0-generate-002`	آخرین نسخه پایدار Imagen 3	پایدار	۲۰۲۵-۰۱-۲۳	زودتر از 2026-01-23 مجاز نیست
`imagen-3.0-generate-001` ³	نسخه پایدار اولیه Imagen 3	پایدار	۲۰۲۴-۰۷-۳۱	زودتر از 2025-07-31 مجاز نیست

نام مدل‌های سریع Imagen 3

نام مدل	توضیحات	مرحله انتشار	تاریخ انتشار	تاریخ بازنشستگی
`imagen-3.0-fast-generate-001` ³	نسخه پایدار اولیه Imagen 3 Fast	پایدار	۲۰۲۴-۰۷-۳۱	زودتر از 2025-07-31 مجاز نیست

^{۳ صرف نظر از نحوه دسترسی شما، توسط رابط برنامه‌نویسی کاربردی توسعه‌دهندگان Gemini پشتیبانی نمی‌شود.}

مراحل بعدی

قابلیت‌های رابط برنامه‌نویسی Gemini را امتحان کنید

مکالمات چند نوبتی (چت) بسازید.
تولید متن از درخواست‌های فقط متنی .
با استفاده از انواع فایل‌های مختلف، مانند تصاویر ، فایل‌های PDF ، ویدیو و صدا ، متن را با پرس‌وجو تولید کنید.
خروجی ساختاریافته (مانند JSON) را از هر دو حالت متنی و چندوجهی تولید کنید.
تصاویر را از متن‌های پیشنهادی ( Gemini یا Imagen ) تولید کنید.
ورودی و خروجی (از جمله صدا) را با استفاده از Gemini Live API استریم کنید.
از ابزارهایی (مانند فراخوانی تابع و اتصال به زمین با جستجوی گوگل ) برای اتصال یک مدل Gemini به سایر بخش‌های برنامه و سیستم‌ها و اطلاعات خارجی خود استفاده کنید.

مدل‌های عمومی

پرش به مقایسه مدل‌ها

باهوش‌ترین مدل ما

جمینی ۳ پرو

gemini-3-pro-preview

مدل تفکر پیشرفته ما

جمینی ۲.۵ پرو

gemini-2.5-pro

سریع و هوشمند

فلش جمینی ۲.۵

gemini-2.5-flash

فوق العاده سریع

جمینی ۲.۵ فلش-لایت

gemini-2.5-flash-lite

سریع‌ترین مدل فلش ما برای صرفه‌جویی در هزینه و توان عملیاتی بالا بهینه شده است.

مدل‌های تولید تصویر

شما می‌توانید تصاویر را با مدل‌های Gemini یا Imagen تولید کنید.

پرش به مقایسه مدل‌ها

جوزا

تصویر Gemini 3 Pro (معروف به نانو موز پرو )

gemini-3-pro-image-preview

ایمیج فلش Gemini 2.5 (معروف به نانو موز )

gemini-2.5-flash-image

ایمیجِن

تصویر ۴

imagen-4.0-generate-001

تصاویر واقعی و با کیفیت بالا را از متن‌های زبان طبیعی تولید می‌کند. (نیاز به پرداخت هزینه دارد)

ایمجین ۴ سریع

imagen-4.0-fast-generate-001

تصاویر را برای نمونه‌سازی اولیه یا موارد استفاده با تأخیر کم تولید می‌کند. (نیاز به پرداخت صورتحساب)

ایمیجن ۴ اولترا

imagen-4.0-ultra-generate-001

تصاویر واقعی و با کیفیت بالا را از متن‌های زبان طبیعی تولید می‌کند. (نیاز به پرداخت هزینه دارد)

مدل‌های تولید صدا

شما می‌توانید با مدل‌هایی که از Gemini Live API پشتیبانی می‌کنند، صدای استریم شده تولید کنید.

پرش به مقایسه مدل‌ها

فلش Gemini 2.5 با صدای بومی Gemini Live API

رابط برنامه‌نویسی کاربردی توسعه‌دهندگان Gemini: gemini-2.5-flash-native-audio-preview-12-2025

رابط برنامه‌نویسی کاربردی Vertex AI Gemini: gemini-live-2.5-flash-native-audio

تعاملات صوتی و تصویری با تأخیر کم و بلادرنگ را با مدل Gemini که دو طرفه است، امکان‌پذیر می‌کند.

مدل‌های نسل قبلی

پرش به مقایسه مدل‌ها

مدل‌های جمینی

مدل نسل دوم و کارآمد ما

فلش جمینی ۲.۰

gemini-2.0-flash-001

مدل سریع نسل دوم ما

جمینی ۲.۰ فلش-لایت

gemini-2.0-flash-lite-001

مدل کوچک و کارآمد نسل دوم ما، با پنجره زمینه ۱ میلیون توکن. بهینه شده برای بهره‌وری هزینه و تأخیر کم.

ادامه‌ی این صفحه اطلاعات دقیقی در مورد مدل‌های پشتیبانی‌شده توسط Firebase AI Logic ارائه می‌دهد.

مقایسه مدل‌ها :
- ورودی و خروجی پشتیبانی شده
- مقایسه سطح بالا از قابلیت‌های پشتیبانی‌شده
- مشخصات و محدودیت‌ها، برای مثال حداکثر توکن‌های ورودی یا حداکثر طول ویدیوی ورودی
شرح نحوه‌ی نسخه‌بندی مدل‌ها ، به ویژه نسخه‌های پایدار ، به‌روزرسانی خودکار ، پیش‌نمایش و آزمایشی آنها
فهرست نام مدل‌های موجود برای گنجاندن در کد شما در هنگام مقداردهی اولیه
لیست زبان‌های پشتیبانی‌شده برای مدل‌ها

در پایین این صفحه، می‌توانید اطلاعات دقیقی در مورد مدل‌های نسل قبلی مشاهده کنید .

مقایسه مدل‌ها

رابط برنامه‌نویسی کاربردی توسعه‌دهندگان Gemini : مدل‌های Gemini و مدل‌های Imagen
Vertex AI Gemini API : مدل‌های Gemini و مدل‌های Imagen

ورودی و خروجی پشتیبانی شده

اینها انواع ورودی و خروجی پشتیبانی شده هنگام استفاده از هر مدل با Firebase AI Logic هستند:

	جوزا ۳ پرو	جوزا ۳ پرو تصویر	جوزا ۲.۵ پرو، فلش، فلش-لایت	جوزا ۲.۵ فلش تصویر	جوزا ۲.۵ فلش- زنده *******	تصویر (تولید)	تصویر (قابلیت)
انواع ورودی
متن					(پخش جریانی)
کد
اسناد (پی‌دی‌اف یا متن ساده)
تصاویر
ویدئو					(پخش جریانی)
صوتی					(پخش جریانی)
انواع خروجی
متن
متن (پخش)					(رونویسی)
کد
خروجی ساختاریافته (مثل جیسون)
تصاویر
صوتی					(پخش جریانی)

برای آشنایی با انواع فایل‌های پشتیبانی‌شده، به بخش فایل‌های ورودی پشتیبانی‌شده و الزامات مراجعه کنید.

قابلیت‌ها و ویژگی‌های پشتیبانی‌شده

این قابلیت‌ها و ویژگی‌های پشتیبانی‌شده هنگام استفاده از هر مدل با Firebase AI Logic هستند:

	جوزا ۳ پرو تصویر	جوزا ۲.۵ فلش تصویر	جوزا ۲.۵ فلش- زنده *******
تفکر
تولید متن از ورودی‌های فقط متنی یا چندوجهی	به صورت لایه لایه یا به عنوان بخشی از تصویر	به صورت لایه لایه یا به عنوان بخشی از تصویر	فقط رونویسی
تولید تصاویر ( جوزا یا ایمیجن )
ویرایش تصاویر ( جوزا یا ایمیجن )
تولید صدا			فقط پخش جریانی
تولید خروجی ساختاریافته (مثل جیسون)
اسناد را تجزیه و تحلیل کنید (پی‌دی‌اف یا متن ساده)
تحلیل تصاویر (بینایی)
تجزیه و تحلیل ویدیو (بینایی)			فقط پخش جریانی
تجزیه و تحلیل صدا			فقط پخش جریانی
چت چند نوبتی			فقط پخش جریانی
جریان‌سازی چندوجهی دوطرفه
فراخوانی تابع
اجرای کد
اتصال به زمین با جستجوی گوگل
دستورالعمل‌های سیستم
تعداد توکن‌ها

مشخصات و محدودیت‌ها

مشخصات و محدودیت‌های استفاده از هر مدل با Firebase AI Logic به شرح زیر است:

ملک	جوزا ۳ پرو	جوزا ۳ پرو تصویر	جوزا ۲.۵ پرو، فلش، فلش-لایت	جوزا ۲.۵ فلش تصویر	جوزا ۲.۵ فلش- زنده *******	تصویر (تولید)	تصویر (قابلیت)
محدودیت توکن ورودی *	۱,۰۴۸,۵۷۶ توکن	۶۵,۵۳۶ توکن	۱,۰۴۸,۵۷۶ توکن	۳۲۷۶۸ توکن	۳۲ هزار توکن (پیش‌فرض؛ قابل ارتقا به ۱۲۸ هزار)	۴۸۰ توکن	۴۸۰ توکن
محدودیت توکن خروجی *	۶۵,۵۳۶ توکن	۳۲۷۶۸ توکن	۶۵,۵۳۶ توکن	۸,۱۹۲ توکن	۶۴ هزار توکن	---	---
تاریخ پایان دانش	ژانویه ۲۰۲۵	ژانویه ۲۰۲۵	ژانویه ۲۰۲۵	ژوئن ۲۰۲۵	ژانویه ۲۰۲۵	---	---
فایل‌های PDF (بنا به درخواست)
حداکثر تعداد از فایل‌های PDF ورودی **	۹۰۰ فایل	۱۴ فایل	۳۰۰۰ فایل	۳ فایل	---	---	---
حداکثر تعداد از صفحات به ازای هر فایل PDF ورودی **	۹۰۰ صفحه	۱۴ صفحه	۱۰۰۰ صفحه	۳ صفحه	---	---	---
حداکثر اندازه به ازای هر فایل PDF ورودی	۵۰ مگابایت	۵۰ مگابایت	۵۰ مگابایت	۵۰ مگابایت	---	---	---
تصاویر (بنا به درخواست)
حداکثر تعداد از تصاویر ورودی	۱۰۰۰ تصویر	۱۴ تصویر	۳۰۰۰ تصویر	۳ تصویر	---	---	۴ تصویر
حداکثر تعداد از تصاویر خروجی	---	۱۰ تصویر	---	۱۰ تصویر	---	۴ تصویر	۴ تصویر
حداکثر اندازه تصویر کدگذاری شده با base64 به ازای هر ورودی	۷ مگابایت	۷ مگابایت	۷ مگابایت	۷ مگابایت	---	---	---
ویدئو (به درخواست)
حداکثر تعداد از فایل‌های ویدیویی ورودی	۱۰ فایل	---	۱۰ فایل	---	---	---	---
حداکثر طول از تمام ویدیوهای ورودی (فقط قاب‌ها)	حدود ۶۰ دقیقه	---	حدود ۶۰ دقیقه	---	---	---	---
حداکثر طول از تمام ویدیوهای ورودی (فریم‌ها + صدا)	حدود ۴۵ دقیقه	---	حدود ۴۵ دقیقه	---	---	---	---
صدا (به درخواست)
حداکثر تعداد از فایل‌های صوتی ورودی	۱ فایل	---	۱ فایل	---	---	---	---
حداکثر تعداد از فایل‌های صوتی خروجی	---	---	---	---	---	---	---
حداکثر طول از تمام صداهای ورودی	حدود ۸.۴ ساعت	---	حدود ۸.۴ ساعت	---	---	---	---
حداکثر طول از تمام صداهای خروجی	---	---	---	---	---	---	---

^{*** مدل‌های Gemini 2.5 Flash-Live مدل‌های صوتی بومی هستند که از Gemini Live API پشتیبانی می‌کنند.}

اطلاعات دقیق اضافی را پیدا کنید

سهمیه‌ها و قیمت‌گذاری برای هر مدل متفاوت است. قیمت‌گذاری همچنین به ورودی و خروجی بستگی دارد.
در مورد انواع فایل‌های ورودی پشتیبانی‌شده، نحوه تعیین نوع MIME و نحوه اطمینان از اینکه فایل‌های ورودی و درخواست‌های چندوجهی شما الزامات را برآورده می‌کنند و از بهترین شیوه‌ها در فایل‌ها و الزامات ورودی پشتیبانی‌شده پیروی می‌کنند، اطلاعات کسب کنید.
مهم : محدودیت حجم کل درخواست ۲۰ مگابایت است. برای ارسال فایل‌های بزرگ، گزینه‌های ارائه فایل‌ها در درخواست‌های چندوجهی را بررسی کنید.

الگوهای نسخه‌بندی و نامگذاری مدل

برای یافتن نام‌های مدل خاص برای استفاده در کد خود، به بخش «نام‌های مدل موجود» در ادامه همین صفحه مراجعه کنید.

نوع نسخه / مرحله انتشار		توضیحات	الگوی نام مدل
پایدار		نسخه‌های *پایدار* از تاریخ انتشار برای استفاده در محیط عملیاتی در دسترس و پشتیبانی می‌شوند. یک نسخه پایدار از مدل معمولاً با یک تاریخ انقضا منتشر می‌شود که نشان‌دهنده آخرین روزی است که مدل در دسترس است. پس از این تاریخ، مدل دیگر توسط گوگل قابل دسترسی یا پشتیبانی نیست.	مدل‌های جمینی ۲.۵ نام مدل‌های نسخه‌های پایدار پسوند ندارند مثال: `gemini-2.5-pro` مدل‌های Gemini 2.0 و Imagen نام مدل‌های نسخه‌های پایدار با یک شماره نسخه سه رقمی خاص ضمیمه می‌شوند مثال: `gemini-2.0-flash-001` مثال: `imagen-3.0-generate-002`
	نام مستعار پایدار با به‌روزرسانی خودکار (فقط مدل‌های Gemini 2.0 )	نام‌های مستعار پایدار *که به صورت خودکار به‌روزرسانی می‌شوند،* همیشه به آخرین نسخه پایدار آن مدل اشاره می‌کنند. اگر نسخه پایدار جدیدی منتشر شود، نام مستعار به‌روزرسانی‌شده خودکار به‌طور خودکار شروع به اشاره به آن نسخه پایدار جدید می‌کند.	فقط مدل‌های Gemini 2.0 نام‌های مدلِ مستعار پسوند ندارند مثال: `gemini-2.0-flash`
پیش‌نمایش		نسخه‌های *پیش‌نمایش* دارای قابلیت‌های جدیدی هستند و پایدار محسوب نمی‌شوند . این مدل‌ها برای استفاده در تولید توصیه نمی‌شوند ، محدودیت‌های نرخ محدودتری دارند و ممکن است الزامات صورتحساب داشته باشند. این مدل‌ها ظرف چند هفته یا چند ماه پس از انتشار نسخه پایدار مرتبط با آنها، از رده خارج می‌شوند. برای رابط برنامه‌نویسی کاربردی Vertex AI Gemini ، مدل‌های پیش‌نمایش منتشر شده پس از ژوئن ۲۰۲۵ معمولاً از شما می‌خواهند که موقعیت مکانی مدل را روی `global` تنظیم کنید .	Model names of preview versions are appended with `-preview` and often the model's release date ( `-MM-DD` for older models or `-MM-YYYY` for newer models) مثال‌ها: `gemini-2.5-flash-preview-04-17` (released on April 17, 2025) یا `gemini-2.5-flash-preview-09-2025` (released in September 2025) یا `gemini-3-pro-preview` (released in November 2025)
تجربی		*Experimental* versions have new capabilities and are considered not stable . These models are not recommended for production use and come with more restrictive rate limits. Experimental models are intended for gathering feedback and to enable experimentation with our latest features. These models are retired within a few weeks or months after their associated stable version is released. For the Vertex AI Gemini API , experimental models released after June 2025 require you to set the model's location to `global` .	Model names of experimental versions are appended with `-exp` along with the model's release date ( `-MM-DD` ) مثال: `gemini-2.5-pro-exp-03-25` (released on March 25, 2025)
بازنشسته		*Retired* versions are past their retirement date and have been permanently deactivated. Retired models are no longer accessible or supported by Google, and a request using a retired model name returns a 404 error.	---

Available model names

Model names are the explicit values that you include in your code during initialization of the model.

Jump to Gemini model names Jump to Imagen model names

Programmatically list all available models

You can list all available models names using the REST API:

Gemini Developer API : Call the models.list endpoint
Vertex AI Gemini API : Call the publishers.models.list endpoint

Note that this returned list will include all models supported by the API providers, but Firebase AI Logic only supports the Gemini and Imagen models described on this page. Also note that auto-updated aliases (for example, gemini-2.0-flash ) aren't listed because they're a convenience alias for the base model.

Gemini model names

For initialization examples for your platform, see the getting started guide .

For details about the release stages (especially for use cases, billing, and retirement), see model versioning and naming patterns .

Important : Stable Gemini 2.5 model names do not have a three-digit suffix, and they do not have an auto-updated alias.

Also, if you're using the Vertex AI Gemini API , all Gemini 3 and Gemini 2.5 preview models (except Gemini Live API models) that are released after June 2025 are only available in the global location.

Gemini 3 Pro model names

نام مدل	توضیحات	Release stage	تاریخ انتشار	Retirement date
`gemini-3-pro-preview`	Preview version of Gemini 3 Pro	پیش‌نمایش	۲۰۲۵-۱۱-۱۸	تعیین خواهد شد

Gemini 3 Pro Image model names (aka "nano banana pro")

نام مدل	توضیحات	Release stage	تاریخ انتشار	Retirement date
`gemini-3-pro-image-preview`	Preview version of Gemini 3 Pro Image (aka "nano banana pro")	پیش‌نمایش	۲۰۲۵-۱۱-۲۰	تعیین خواهد شد

Gemini 2.5 Pro model names

نام مدل	توضیحات	Release stage	تاریخ انتشار	Retirement date
`gemini-2.5-pro`	Stable version of Gemini 2.5 Pro	پایدار	۲۰۲۵-۰۶-۱۷	No earlier than 2026-06-17

Gemini 2.5 Flash model names

نام مدل	توضیحات	Release stage	تاریخ انتشار	Retirement date
`gemini-2.5-flash`	Stable version of Gemini 2.5 Flash	پایدار	۲۰۲۵-۰۶-۱۷	No earlier than 2026-06-17

Gemini 2.5 Flash‑Lite model names

نام مدل	توضیحات	Release stage	تاریخ انتشار	Retirement date
`gemini-2.5-flash-lite`	Stable version of Gemini 2.5 Flash‑Lite	پایدار	۲۰۲۵-۰۷-۲۲	No earlier than 2026-07-22

Gemini 2.5 Flash Image model names (aka "nano banana")

نام مدل	توضیحات	Release stage	تاریخ انتشار	Retirement date
`gemini-2.5-flash-image`	Stable version for Gemini 2.5 Flash Image (aka "nano banana")	پایدار	۲۰۲۵-۱۰-۰۲	No earlier than 2026-10-02

Gemini 2.5 Flash Live model names

Gemini 2.5 Flash Live models are the native audio models that support the Gemini Live API . Even though the model has different model names depending on the Gemini API provider, the behavior and features of the model are the same.

رابط برنامه‌نویسی کاربردی (API) توسعه‌دهندگان جمینی نام مدل	توضیحات	Release stage	تاریخ انتشار	Retirement date
`gemini-2.5-flash-native-audio-preview-12-2025` ¹	Latest preview version for the Live API on the Gemini Developer API	پیش‌نمایش	۲۰۲۵-۱۲-۱۲	تعیین خواهد شد
`gemini-2.5-flash-native-audio-preview-09-2025` ¹	Initial preview version for the Live API on the Gemini Developer API	پیش‌نمایش	۲۰۲۵-۰۹-۱۸	تعیین خواهد شد

Vertex AI Gemini API نام مدل	توضیحات	Release stage	تاریخ انتشار	Retirement date
`gemini-live-2.5-flash-native-audio` ²	Stable version for the Live API on the Vertex AI Gemini API	پایدار	۲۰۲۵-۱۲-۱۲	No earlier than 2026-12-12
`gemini-live-2.5-flash-preview-native-audio-09-2025` ²	Preview version for the Live API on the Vertex AI Gemini API	پیش‌نمایش	۲۰۲۵-۰۹-۱۸	تعیین خواهد شد

^{1 Only supported by the Gemini Developer API . Also, even though these are preview models, they're available on the "free tier" of the Gemini Developer API .}
^{2 Only supported by the Vertex AI Gemini API . Also, these models are not supported in the global location.}

Imagen model names

For initialization examples for your platform, see the generate images with Imagen guide .

For details about the release stages (especially for use cases, billing, and retirement), see model versioning and naming patterns .

Imagen 4 model names

نام مدل	توضیحات	Release stage	تاریخ انتشار	Retirement date
`imagen-4.0-generate-001`	Stable version of Imagen 4	پایدار	۱۴-۰۸-۲۰۲۵	No earlier than 2026-08-14

Imagen 4 Fast model names

نام مدل	توضیحات	Release stage	تاریخ انتشار	Retirement date
`imagen-4.0-fast-generate-001`	Stable version of Imagen 4 Fast	پایدار	۱۴-۰۸-۲۰۲۵	No earlier than 2026-08-14

Imagen 4 Ultra model names

نام مدل	توضیحات	Release stage	تاریخ انتشار	Retirement date
`imagen-4.0-ultra-generate-001`	Stable version of Imagen 4 Ultra	پایدار	۱۴-۰۸-۲۰۲۵	No earlier than 2026-08-14

Imagen 3 Capability model names

نام مدل	توضیحات	Release stage	تاریخ انتشار	Retirement date
`imagen-3.0-capability-001` ²	Initial stable version of Imagen 3 Capability	پایدار	۲۰۲۴-۱۲-۱۰	No earlier than 2025-12-10

^{2 Not supported by the Gemini Developer API no matter how you access it.}

زبان‌های پشتیبانی‌شده جوزا

All the Gemini models can understand and respond in the following languages:
Arabic (ar), Bengali (bn), Bulgarian (bg), Chinese simplified and traditional (zh), Croatian (hr), Czech (cs), Danish (da), Dutch (nl), English (en), Estonian (et), Finnish (fi), French (fr), German (de), Greek (el), Hebrew (iw), Hindi (hi), Hungarian (hu), Indonesian (id), Italian (it), Japanese (ja), Korean (ko), Latvian (lv), Lithuanian (lt), Norwegian (no), Polish (pl), Portuguese (pt), Romanian (ro), Russian (ru), Serbian (sr), Slovak (sk), Slovenian (sl), Spanish (es), Swahili (sw), Swedish (sv), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi)
Gemini 2.0 Flash , Gemini 1.5 Pro and Gemini 1.5 Flash models can understand and respond in the following additional languages:
Afrikaans (af), Amharic (am), Assamese (as), Azerbaijani (az), Belarusian (be), Bosnian (bs), Catalan (ca), Cebuano (ceb), Corsican (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persian (fa), Filipino (Tagalog) (fil), Frisian (fy), Irish (ga), Scots Gaelic (gd), Galician (gl), Gujarati (gu), Hausa (ha), Hawaiian (haw), Hmong (hmn), Haitian Creole (ht), Armenian (hy), Igbo (ig), Icelandic (is), Javanese (jv), Georgian (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdish (ku), Kyrgyz (ky), Latin (la), Luxembourgish (lb), Lao (lo), Malagasy (mg), Maori (mi), Macedonian (mk), Malayalam (ml), Mongolian (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Malay (ms), Maltese (mt), Myanmar (Burmese) (my), Nepali (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoan (sm), Shona (sn), Somali (so), Albanian (sq), Sesotho (st), Sundanese (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)

ایمیجِن

General availability : English
Preview : Chinese (simplified), Chinese (traditional), Hindi, Japanese, Korean, Portuguese, Spanish

Information about previous models

The following are active, but previous generation models. We recommend using one of the latest models instead when possible.

مدل‌های جمینی

gemini-2.0-flash-001 (and its auto-updated alias gemini-2.0-flash )
gemini-2.0-flash-lite-001 (and its auto-updated alias gemini-2.0-flash-lite )

For information about older Gemini Live API models, see the Gemini API provider documentation:

Imagen models

imagen-3.0-generate-002
imagen-3.0-fast-generate-001

All Gemini 1.0 models and Gemini 1.5 are retired, and all requests to these models return a 404 error. To avoid service disruption, update to a newer model (for example, gemini-2.5-flash-lite ). Learn more.

When you start seriously developing your app, we recommend using Firebase Remote Config so that you can remotely change the model and version in your app without releasing a new version of your app.

View supported input and output of previous generation models

These are the input and output types when using each model with Firebase AI Logic :

	جوزا 2.0 Flash	جوزا 2.0 Flash- لایت
Input types
متن
Text (streaming)
کد
اسناد (PDFs or plain-text)
تصاویر
ویدئو
صوتی
Audio (streaming)
انواع خروجی
متن
Text (streaming)
کد
خروجی ساختاریافته (like JSON)
تصاویر
صوتی
Audio (streaming)

Supported capabilities and features of previous generation models

These are the capabilities and features when using each model with Firebase AI Logic :

	جوزا 2.0 Flash	جوزا 2.0 Flash- لایت
تفکر
Generate text from text-only or multimodal inputs
تولید تصاویر ( Gemini or Imagen )
Edit images ( Gemini or Imagen )
تولید صدا
Generate structured output (like JSON)
Analyze documents (PDFs or plain-text)
Analyze images (vision)
Analyze video (vision)
تجزیه و تحلیل صدا
Multi-turn chat
Bidirectional multimodal streaming
فراخوانی تابع
اجرای کد
اتصال به زمین با جستجوی گوگل
دستورالعمل‌های سیستم
تعداد توکن‌ها

Specifications and limitations of previous generation models

These are the specifications and limitations when using each model with Firebase AI Logic :

ملک	جوزا 2.0 Flash	جوزا 2.0 Flash- لایت
Context window * Total token limit (combined input+output)	1,048,576 tokens	1,048,576 tokens
Output token limit *	8,192 tokens	8,192 tokens
Knowledge cutoff date	ژوئن ۲۰۲۴	ژوئن ۲۰۲۴
PDFs (per request)
Max number of input PDF files **	3,000 files	3,000 files
Max number of pages per input PDF file **	1,000 pages	1,000 pages
حداکثر اندازه per input PDF file	۵۰ مگابایت	۵۰ مگابایت
Images (per request)
Max number of input images	3,000 images	3,000 images
Max number of output images	---	---
حداکثر اندازه per input base64-encoded image	۷ مگابایت	۷ مگابایت
Video (per request)
Max number of input video files	۱۰ فایل	۱۰ فایل
حداکثر طول of all input video (frames only)	~60 minutes	~60 minutes
حداکثر طول of all input video (frames+audio)	~45 minutes	~45 minutes
Audio (per request)
Max number of input audio files	۱ فایل	۱ فایل
Max number of output audio files	---	---
حداکثر طول of all input audio	~8.4 hours	~8.4 hours
حداکثر طول of all output audio	---	---

^{* For all Gemini models, a token is equivalent to about 4 characters, so 100 tokens are about 60-80 English words. For Gemini models, you can determine the total count of tokens in your requests using countTokens .}

^{** PDFs are treated as images, so a single page of a PDF is treated as one image. The number of pages allowed in a request is limited to the number of images the model can support.}

Available model names of previous generation models (including retirement dates)

Model names are the explicit values that you include in your code during initialization of the model.

مدل‌های جمینی Gemini 2.0 Flash model names

نام مدل	توضیحات	Release stage	تاریخ انتشار	Retirement date
`gemini-2.0-flash-001`	Latest stable version of Gemini 2.0 Flash	پایدار	۲۰۲۵-۰۲-۰۵	No earlier than 2026-02-05
`gemini-2.0-flash`	Auto-updated alias pointing to the latest stable version of Gemini 2.0 Flash (currently `gemini-2.0-flash-001` )	پایدار	۲۰۲۵-۰۲-۱۰	---

Gemini 2.0 Flash‑Lite model names

نام مدل	توضیحات	Release stage	تاریخ انتشار	Retirement date
`gemini-2.0-flash-lite-001`	Latest stable version of Gemini 2.0 Flash‑Lite	پایدار	2025-02-25	No earlier than 2026-02-25
`gemini-2.0-flash-lite`	Auto-updated alias pointing to the latest stable version of Gemini 2.0 Flash‑Lite (currently `gemini-2.0-flash-lite-001` )	پایدار	2025-02-25	---

Imagen models Imagen 3 model names

نام مدل	توضیحات	Release stage	تاریخ انتشار	Retirement date
`imagen-3.0-generate-002`	Latest stable version of Imagen 3	پایدار	۲۰۲۵-۰۱-۲۳	No earlier than 2026-01-23
`imagen-3.0-generate-001` ³	Initial stable version of Imagen 3	پایدار	۲۰۲۴-۰۷-۳۱	No earlier than 2025-07-31

Imagen 3 Fast model names

نام مدل	توضیحات	Release stage	تاریخ انتشار	Retirement date
`imagen-3.0-fast-generate-001` ³	Initial stable version of Imagen 3 Fast	پایدار	۲۰۲۴-۰۷-۳۱	No earlier than 2025-07-31

^{3 Not supported by the Gemini Developer API no matter how you access it.}

مراحل بعدی

Try out the capabilities of the Gemini API

Build multi-turn conversations (chat) .
Generate text from text-only prompts .
Generate text by prompting with various file types, like images , PDFs , video , and audio .
Generate structured output (like JSON) from both text and multimodal prompts.
Generate images from text prompts ( Gemini or Imagen ).
Stream input and output (including audio) using the Gemini Live API .
Use tools (like function calling and grounding with Google Search ) to connect a Gemini model to other parts of your app and external systems and information.