Imagen, Google'ın yüksek kaliteli görüntü üretme modelidir. Metin istemlerinden gerçekçi ve yüksek kaliteli görüntüler üretebilir. Üretilen tüm görüntülerde SynthID filigranı bulunur. Kullanılabilen Imagen modeli varyantları hakkında daha fazla bilgi edinmek için Model sürümleri bölümüne bakın.
Imagen modellerini kullanarak resim oluşturma
Bu örnekte, Imagen modeliyle görüntü oluşturma gösterilmektedir:
Python
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
client = genai.Client()
response = client.models.generate_images(
model='imagen-4.0-generate-001',
prompt='Robot holding a red skateboard',
config=types.GenerateImagesConfig(
number_of_images= 4,
)
)
for generated_image in response.generated_images:
generated_image.image.show()
JavaScript
import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({});
const response = await ai.models.generateImages({
model: 'imagen-4.0-generate-001',
prompt: 'Robot holding a red skateboard',
config: {
numberOfImages: 4,
},
});
let idx = 1;
for (const generatedImage of response.generatedImages) {
let imgBytes = generatedImage.image.imageBytes;
const buffer = Buffer.from(imgBytes, "base64");
fs.writeFileSync(`imagen-${idx}.png`, buffer);
idx++;
}
}
main();
Go
package main
import (
"context"
"fmt"
"os"
"google.golang.org/genai"
)
func main() {
ctx := context.Background()
client, err := genai.NewClient(ctx, nil)
if err != nil {
log.Fatal(err)
}
config := &genai.GenerateImagesConfig{
NumberOfImages: 4,
}
response, _ := client.Models.GenerateImages(
ctx,
"imagen-4.0-generate-001",
"Robot holding a red skateboard",
config,
)
for n, image := range response.GeneratedImages {
fname := fmt.Sprintf("imagen-%d.png", n)
_ = os.WriteFile(fname, image.Image.ImageBytes, 0644)
}
}
REST
curl -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/imagen-4.0-generate-001:predict" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"instances": [
{
"prompt": "Robot holding a red skateboard"
}
],
"parameters": {
"sampleCount": 4
}
}'
Imagen yapılandırması
Imagen şu anda yalnızca İngilizce istemleri ve aşağıdaki parametreleri desteklemektedir:
numberOfImages: Oluşturulacak resim sayısı (1-4 arası). Varsayılan değer 4'tür.imageSize: Oluşturulan resmin boyutu. Bu özellik yalnızca Standart ve Ultra modellerinde desteklenir. Desteklenen değerler1Kve2K'dir. Varsayılan değer1K'dır.aspectRatio: Oluşturulan resmin en-boy oranını değiştirir. Desteklenen değerler:"1:1","3:4","4:3","9:16"ve"16:9". Varsayılan değer:"1:1".personGeneration: Modelin insan resimleri oluşturmasına izin verilir. Aşağıdaki değerler desteklenir:"dont_allow": İnsanların yer aldığı görüntülerin üretilmesini engelleme"allow_adult": Çocukların değil, yetişkinlerin resimlerini üretin. Bu, varsayılan seçenektir."allow_all": Yetişkinlerin ve çocukların yer aldığı görüntüler üretin.
Imagen istem kılavuzu
Imagen kılavuzunun bu bölümünde, metinden resme istemini değiştirmenin nasıl farklı sonuçlar verebileceği ve oluşturabileceğiniz resim örnekleri gösterilmektedir.
İstem yazmayla ilgili temel bilgiler
İyi bir istem açıklayıcı ve net olmalı, anlamlı anahtar kelimeler ve değiştiriciler kullanmalıdır. Özne, bağlam ve stil ile ilgili düşünerek başlayın.
Özne: Her istemde ilk olarak özne düşünülmelidir. Özne, resmini istediğiniz nesne, kişi, hayvan veya manzaradır.
Bağlam ve arka plan: Konunun yerleştirileceği arka plan veya bağlam da aynı derecede önemlidir. Öznenizi çeşitli arka planlara yerleştirmeyi deneyin. Örneğin, beyaz arka planlı bir stüdyo, dış mekanlar veya iç mekanlar.
Stil: Son olarak, istediğiniz resim stilini ekleyin. Stiller genel (tablo, fotoğraf, eskiz) veya çok özel (pastel boya, kömür çizimi, izometrik 3D) olabilir. Stilleri de birleştirebilirsiniz.
İstemin ilk sürümünü yazdıktan sonra, istediğiniz görüntüye ulaşana kadar daha fazla ayrıntı ekleyerek isteminizi iyileştirin. Tekrar önemlidir. Önce temel fikrinizi belirleyin, ardından oluşturulan resim vizyonunuza yakın olana kadar bu temel fikri iyileştirin ve genişletin.
|
|
|
|
Imagen modelleri, istemleriniz kısa veya uzun ve ayrıntılı olsa da fikirlerinizi ayrıntılı görüntülere dönüştürebilir. Mükemmel sonucu elde edene kadar ayrıntı ekleyerek istemleri tekrarlayın ve vizyonunuzu geliştirin.
|
Kısa istemler, hızlı bir şekilde görüntü oluşturmanıza olanak tanır. |
Daha uzun istemler, belirli ayrıntılar eklemenize ve görselinizi oluşturmanıza olanak tanır. |
Imagen istemi yazmayla ilgili ek öneriler:
- Açıklayıcı bir dil kullanın: Imagen'e net bir resim sunmak için ayrıntılı sıfatlar ve zarflar kullanın.
- Bağlam bilgisi verin: Gerekirse yapay zekanın anlamasına yardımcı olmak için arka plan bilgilerini ekleyin.
- Belirli sanatçılardan veya stillerden bahsedin: Aklınızda belirli bir estetik varsa belirli sanatçılardan veya sanat akımlarından bahsetmek faydalı olabilir.
- İstem mühendisliği araçlarını kullanın: İstemlerinizi hassaslaştırmanıza ve optimum sonuçlar elde etmenize yardımcı olacak istem mühendisliği araçlarını veya kaynaklarını inceleyin.
- Kişisel ve grup resimlerinizdeki yüz ayrıntılarını iyileştirme: Yüz ayrıntılarını fotoğrafın odak noktası olarak belirtin (örneğin, istemde "portre" kelimesini kullanın).
Resimlerde metin oluşturma
Imagen modelleri, resimlere metin ekleyerek daha yaratıcı görüntü üretme olanakları sunar. Bu özellikten en iyi şekilde yararlanmak için aşağıdaki kılavuzu inceleyin:
- Güvenle yineleme yapın: İstediğiniz görünümü elde edene kadar resimleri yeniden oluşturmanız gerekebilir. Imagen'in metin entegrasyonu hâlâ gelişmektedir ve bazen birden fazla deneme en iyi sonuçları verir.
- Kısa tutun: En iyi sonuç için metni 25 karakterle sınırlayın.
Birden fazla ifade: Ek bilgi sağlamak için iki veya üç farklı ifadeyle denemeler yapın. Daha net kompozisyonlar için üç ifadeyi aşmayın.
İstem: Başlık olarak "Summerland" metninin kalın yazı tipiyle yazıldığı, bu metnin altında "Summer never felt so good" (Yaz hiç bu kadar güzel olmamıştı) sloganının yer aldığı bir poster oluştur. Yerleşimi yönlendirme: Imagen, metni yönlendirildiği şekilde yerleştirmeye çalışsa da zaman zaman farklılıklar olabilir. Bu özellik sürekli olarak geliştirilmektedir.
Yazı tipi stiline ilham ver: Imagen'in seçimlerini ince bir şekilde etkilemek için genel bir yazı tipi stili belirtin. Yazı tipinin bire bir kopyalanmasını beklemeyin ancak yaratıcı yorumlar bekleyebilirsiniz.
Yazı tipi boyutu: Yazı tipi boyutu oluşturmayı etkilemek için bir yazı tipi boyutu veya genel bir boyut göstergesi (örneğin, küçük, orta, büyük) belirtin.
İstem parametrelendirme
Çıkış sonuçlarını daha iyi kontrol etmek için Imagen'e girişleri parametrelendirmeniz faydalı olabilir. Örneğin, müşterilerinizin işletmeleri için logo oluşturabilmesini ve logoların her zaman düz renk bir arka plan üzerinde oluşturulmasını istediğinizi varsayalım. Ayrıca, müşterinin menüden seçebileceği seçenekleri de sınırlamak istiyorsunuz.
Bu örnekte, aşağıdakine benzer şekilde parametrelendirilmiş bir istem oluşturabilirsiniz:
A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.Müşteri, özel kullanıcı arayüzünüzde parametreleri bir menü kullanarak girebilir ve seçtiği değer, Imagen'in aldığı istemi doldurur.
Örneğin:
İstem:
A minimalist logo for a health care company on a solid color background. Include the text Journey.İstem:
A modern logo for a software company on a solid color background. Include the text Silo.İstem:
A traditional logo for a baking company on a solid color background. Include the text Seed.
Gelişmiş istem yazma teknikleri
Fotoğrafçılık tanımlayıcıları, şekiller ve malzemeler, tarihi sanat akımları ve görüntü kalitesi değiştiricileri gibi özelliklere dayalı daha spesifik istemler oluşturmak için aşağıdaki örnekleri kullanın.
Fotoğrafçılık
- İstem şunları içerir: "... fotoğrafı"
Bu stili kullanmak için Imagen'a fotoğraf aradığınızı net bir şekilde belirten anahtar kelimelerle başlayın. İstemlerinize şu ifadeyle başlayın: "Şunun fotoğrafı: . .". Örneğin:
|
|
|
|
Resim kaynağı: Her resim, Imagen 4 modeliyle ilgili metin istemi kullanılarak oluşturulmuştur.
Fotoğrafçılık değiştiricileri
Aşağıdaki örneklerde, fotoğrafa özel çeşitli değiştiricileri ve parametreleri görebilirsiniz. Daha hassas kontrol için birden fazla değiştiriciyi birleştirebilirsiniz.
Kamera Yakınlığı - Uzaktan çekilen yakın çekim
İstem: Kahve çekirdeklerinin yakın çekim fotoğrafı İstem: Dağınık bir mutfakta küçük bir kahve çekirdeği torbasının uzaklaştırılmış fotoğrafı
Kamera Konumu - aerial, from below (havadan, aşağıdan)
İstem: Gökdelenlerin bulunduğu bir şehir merkezinin havadan fotoğrafı İstem: Aşağıdan çekilmiş, mavi gökyüzüyle birlikte orman kanopisi fotoğrafı Işık: Doğal, dramatik, sıcak, soğuk
İstem: modern bir koltuğun stüdyo fotoğrafı, doğal ışıklandırma İstem: modern bir koltuğun stüdyo fotoğrafı, etkileyici ışıklandırma Kamera Ayarları - hareket bulanıklığı, yumuşak odak, bokeh, portre
İstem: Hareket bulanıklığı olan bir arabanın içinden çekilmiş, gökdelenlerle dolu bir şehir fotoğrafı İstem: Gece, şehirdeki bir köprünün yumuşak odaklı fotoğrafı Lens türleri - 35 mm, 50 mm, balık gözü, geniş açı, makro
İstem: Yaprak fotoğrafı, makro lens İstem: sokak fotoğrafçılığı, New York, balık gözü lens Film türleri - siyah beyaz, polaroid
İstem: Güneş gözlüğü takan bir köpeğin Polaroid portresi İstem: Güneş gözlüğü takan bir köpeğin siyah beyaz fotoğrafı
Resim kaynağı: Her resim, Imagen 4 modeliyle ilgili metin istemi kullanılarak oluşturulmuştur.
İllüstrasyon ve sanat
- İstem şunları içerir: "... painting resmi", "Bir sketch..."
Sanat stilleri, kalemle çizilmiş taslaklar gibi tek renkli stillerden hiper gerçekçi dijital sanat eserlerine kadar çeşitlilik gösterir. Örneğin, aşağıdaki resimlerde farklı stillerle aynı istem kullanılmıştır:
"Arka planda gökdelenler olan, köşeli ve sportif bir elektrikli sedanın [art style or creation technique] resmi"
|
|
|
|
|
|
|
|
Resim kaynağı: Her resim, Imagen 2 modeliyle ilgili metin istemi kullanılarak oluşturulmuştur.
Şekiller ve malzemeler
- İstemde şunlar yer alıyor: "...yapılmış...", "...şeklinde..."
Bu teknolojinin güçlü yönlerinden biri, başka şekilde zor veya imkansız olan görüntüler oluşturabilmenizdir. Örneğin, şirket logonuzu farklı materyaller ve dokularla yeniden oluşturabilirsiniz.
|
|
|
|
Resim kaynağı: Her resim, Imagen 4 modeliyle ilgili metin istemi kullanılarak oluşturulmuştur.
Tarihi sanat referansları
- İstem şunları içeriyor: "...tarzında..."
Bazı stiller yıllar içinde ikonik hale geldi. Aşağıda, deneyebileceğiniz bazı tarihi resim veya sanat tarzları hakkında fikirler verilmiştir.
"[art period or movement] tarzında bir resim oluştur: rüzgar çiftliği"
|
|
|
|
Resim kaynağı: Her resim, Imagen 4 modeliyle ilgili metin istemi kullanılarak oluşturulmuştur.
Resim kalitesi değiştiricileri
Belirli anahtar kelimeler, modelin yüksek kaliteli bir öğe aradığınızı anlamasını sağlayabilir. Kalite değiştiricilere örnek olarak aşağıdakiler verilebilir:
- Genel Değiştiriciler - yüksek kaliteli, güzel, stilize edilmiş
- Fotoğraflar - 4K, HDR, Studio Photo
- Sanat, İllüstrasyon - Profesyonel, ayrıntılı
Aşağıda, kalite değiştiricileri içermeyen istemlere ve aynı istemin kalite değiştiricileri içeren versiyonuna dair birkaç örnek verilmiştir.
|
|
bir mısır koçanı fotoğrafı profesyonel bir fotoğrafçı tarafından çekilmiş |
Resim kaynağı: Her resim, Imagen 4 modeliyle ilgili metin istemi kullanılarak oluşturulmuştur.
En boy oranları
Imagen ile görüntü üretme özelliği, beş farklı görüntü en-boy oranı ayarlamanıza olanak tanır.
- Kare (1:1, varsayılan): Standart bir kare fotoğraf. Bu en boy oranının yaygın kullanım alanları arasında sosyal medya gönderileri yer alır.
Tam ekran (4:3): Bu en boy oranı genellikle medyada veya filmlerde kullanılır. Ayrıca çoğu eski (geniş ekran olmayan) TV'nin ve orta formatlı kameraların boyutlarıdır. Yatay olarak sahnenin daha fazlasını yakalar (1:1 ile karşılaştırıldığında). Bu nedenle, fotoğrafçılıkta tercih edilen bir en boy oranıdır.
İstem: Piyano çalan bir müzisyenin parmaklarının yakın çekimi, siyah beyaz film, vintage (4:3 en boy oranı) İstem: Bir yemek dergisi tarzında, üst düzey bir restoran için patates kızartmasının profesyonel stüdyo fotoğrafı (4:3 en-boy oranı) (4:3 en-boy oranı) Dikey tam ekran (3:4): Bu, 90 derece döndürülmüş tam ekran en boy oranıdır. Bu sayede, 1:1 en boy oranına kıyasla sahnenin daha fazlasını dikey olarak yakalayabilirsiniz.
İstem: Yürüyüş yapan bir kadın, botlarının su birikintisine yansıyan yakın çekimi, arka planda büyük dağlar, reklam tarzında, dramatik açılar (3:4 en-boy oranı) İstem: Bir nehrin mistik bir vadide akarken çekilmiş havadan fotoğrafı (3:4 en-boy oranı) Geniş ekran (16:9): Bu oran, 4:3'ün yerini almıştır ve artık TV'ler, monitörler ve cep telefonu ekranları (yatay) için en yaygın en boy oranıdır. Arka planın daha fazlasını (ör. manzaralar) yakalamak istediğinizde bu en boy oranını kullanın.
İstem: Tamamen beyaz giysiler giymiş bir adamın plajda oturduğu, yakın çekim, altın saat ışığı (16:9 en-boy oranı) Dikey (9:16): Bu oran, geniş ekranın döndürülmüş halidir. Bu, kısa video uygulamaları (ör. YouTube Shorts) tarafından popüler hale getirilen nispeten yeni bir en-boy oranıdır. Binalar, ağaçlar, şelaleler veya benzeri diğer nesneler gibi güçlü dikey yönlere sahip uzun nesneler için kullanın.
İstem: Arka planda güzel bir gün batımı olan, devasa, modern, görkemli ve destansı bir gökdelenin dijital görüntüsü (9:16 en-boy oranı)
Fotoğraf gerçekliğinde görüntüler
Resim üretme modelinin farklı sürümleri, sanatsal ve fotogerçekçi çıkışların bir karışımını sunabilir. Oluşturmak istediğiniz konuya göre daha fotogerçekçi bir çıktı oluşturmak için istemlerde aşağıdaki ifadeleri kullanın.
| Kullanım alanı | Lens türü | Odak uzaklıkları | Ek bilgiler |
|---|---|---|---|
| Kişiler (portreler) | Asal sayı, yakınlaştırma | 24-35mm | Siyah beyaz film, Film noir, Alan derinliği, Çift tonlu (iki renkten bahsedin) |
| Yiyecek, böcek, bitki (nesneler, natürmort) | Makro | 60-105mm | Yüksek ayrıntı, hassas odaklama, kontrollü ışıklandırma |
| Spor, vahşi yaşam (hareket) | Telefoto yakınlaştırma | 100-400mm | Yüksek deklanşör hızı, aksiyon veya hareket takibi |
| Astronomik, manzara (geniş açı) | Geniş Açı | 10-24mm | Uzun pozlama süreleri, keskin odak, uzun pozlama, pürüzsüz su veya bulutlar |
Portreler
| Kullanım alanı | Lens türü | Odak uzaklıkları | Ek bilgiler |
|---|---|---|---|
| Kişiler (portreler) | Asal sayı, yakınlaştırma | 24-35mm | Siyah beyaz film, Film noir, Alan derinliği, Çift tonlu (iki renkten bahsedin) |
Imagen, tablodaki birkaç anahtar kelimeyi kullanarak aşağıdaki portreleri oluşturabilir:
|
|
|
|
|
İstem: 35 mm portre, mavi ve gri çift tonlu bir kadın
Model: imagen-4.0-generate-001
|
|
|
|
|
İstem: 35 mm portre, film noir tarzında bir kadın
Model: imagen-4.0-generate-001
Nesneler
| Kullanım alanı | Lens türü | Odak uzaklıkları | Ek bilgiler |
|---|---|---|---|
| Yiyecek, böcek, bitki (nesneler, natürmort) | Makro | 60-105mm | Yüksek ayrıntı, hassas odaklama, kontrollü ışıklandırma |
Tablodaki birkaç anahtar kelimeyi kullanarak Imagen, aşağıdaki nesne resimlerini oluşturabilir:
|
|
|
|
|
İstem: leaf of a prayer plant, macro lens, 60mm
Model: imagen-4.0-generate-001
|
|
|
|
|
İstem: a plate of pasta, 100mm Macro lens
Model: imagen-4.0-generate-001
Hareket
| Kullanım alanı | Lens türü | Odak uzaklıkları | Ek bilgiler |
|---|---|---|---|
| Spor, vahşi yaşam (hareket) | Telefoto yakınlaştırma | 100-400mm | Yüksek deklanşör hızı, aksiyon veya hareket takibi |
Tablodaki birkaç anahtar kelimeyi kullanarak Imagen, aşağıdaki hareketli görüntüleri oluşturabilir:
|
|
|
|
|
İstem: kazandıran touchdown, hızlı deklanşör hızı, hareket takibi
Model: imagen-4.0-generate-001
|
|
|
|
|
İstem: Ormanda koşan bir geyik, yüksek deklanşör hızı, hareket takibi
Model: imagen-4.0-generate-001
Geniş Açı
| Kullanım alanı | Lens türü | Odak uzaklıkları | Ek bilgiler |
|---|---|---|---|
| Astronomik, manzara (geniş açı) | Geniş Açı | 10-24mm | Uzun pozlama süreleri, keskin odak, uzun pozlama, pürüzsüz su veya bulutlar |
Tablodaki birkaç anahtar kelimeyi kullanarak Imagen aşağıdaki geniş açılı fotoğrafları oluşturabilir:
|
|
|
|
|
İstem: an expansive mountain range, landscape wide angle 10mm
Model: imagen-4.0-generate-001
|
|
|
|
|
İstem: Ayın fotoğrafı, astro fotoğrafçılık, 10 mm geniş açı
Model: imagen-4.0-generate-001
Model sürümleri
Imagen 4
| Mülk | Açıklama |
|---|---|
| Model kodu |
Gemini API
|
| Desteklenen veri türleri |
Giriş Metin Çıkış Resimler |
| Jeton sınırları[*] |
Giriş jetonu sınırı 480 jeton (metin) Çıkış resimleri 1-4 (Ultra/Standart/Hızlı) |
| Son güncelleme | Haziran 2025 |
Imagen 3
Imagen 3 modeli [kullanımdan kaldırıldı](/gemini-api/docs/deprecations).