Kako koristiti Gemini 2.5 Flash Image upite? Evo detaljnog pregleda savjeta koji će vam pomoći da stvorite dosljedne i kreativne slike za svoje likove

·

Kako koristiti Gemini 2.5 Flash Image upite

Google je ranije najavio da su mogućnosti uređivanja slika Gemini u potpunosti nadograđene na Gemini 2.5 Flash Image. Nova verzija modela napravila je značajna poboljšanja u dosljednosti znakova, preciznom uređivanju razgovora i kombiniranju više fotografija za stvaranje novih slika te je izazvala žestoke rasprave na internetu čak i tijekom faze testiranja na slijepo. Kako bi korisnicima omogućio bolje iskorištavanje prednosti ove nadogradnje, Google je također sastavio nekoliko savjeta za pisanje učinkovitih upita.

Kako koristiti Gemini 2.5 Flash Image upite_1

Osnovne mogućnosti generiranja slika  u Geminiju

Prije nego što počnemo, pogledajmo poboljšanja najnovijeg Gemini modela kako bismo mogli razmisliti koje aplikacije možemo isprobati:

  • Dosljednost dizajna likova: Održavajte dosljedan izgled lika ili objekta tijekom više krugova generiranja i uređivanja.
  • Kreativna kompozicija: Pomiješajte različite elemente, subjekte i stilove u jedinstvenu sliku.
  • Lokalno uređivanje: Možete koristiti jednostavan jezik za precizne izmjene određenih područja slike.
  • Primjena dizajna i izgleda: Sposobnost primjene stilova, tekstura ili dizajna iz jednog koncepta u drugi.
  • Logika i rasuđivanje: Posjedovati sposobnost razumijevanja odnosa u stvarnom svijetu, generiranja složenih scenarija ili predviđanja sljedećih korakaElemenata pisanja učinkovitih upita

Iako Gemini još uvijek može generirati dobre rezultate unosom jednostavnog opisa, kao što je “pas koji trči po travnjaku”, ako se želite približiti svojoj mašti ili želite veću kontrolu nad detaljima, preporuča se uključiti sljedećih šest elemenata u upit:

Tko je središnji lik ili objekt na slici? 

  • Primjer – robotski barista hladnog lica sa svjetlećim plavim optičkim očima ili Pahuljasta mačka s tri cvijeta koja nosi mali čarobnjački šešir.
  • Sastav: krupni plan, širokokutni, niskokutni snimci, portreti.
    Akcija: Što se događa u sceni? Primjerice kuhanje kave, izvođenje magije, trčanje po polju.
    Lokacija ili okruženje scenarija i pozadinski primjeri: Futuristički kafić na Marsu, pretrpana knjižnica alkemičara, Sunčana livada tijekom Zlatnog sata itd.
  • Stil: 3D animacija, film noir, akvarel, realistična fotografija, fotografija proizvoda iz 1990-ih.

Upute za uređivanje: Ako mijenjate postojeće slike, budite izravni i jasni. Primjerice, zamijenite mušku kravatu zelenom i uklonite automobil u pozadini.

5 najboljih savjeta, strategija i primjera referenci

Različite strategije savjeta mogu otključati sve, od realističnog uređivanja do fantastičnih novih svjetova. Gemini može zadržati temeljne karakteristike lika u različitim pozama, osvjetljenju i scenama, pa čak i primijeniti nove stilove na isti lik:

Upit: Napravi neobičnu ilustraciju koja prikazuje svjetlećeg malog vilenjaka gljive. Vilenjak nosi ogroman bioluminiscentni šešir od gljiva s velikim, znatiželjnim očima i tijelom od tkane loze.

Upit 2 (u istom dijalogu): Sada neka isti vilenjak jaše na leđima prijateljskog puža obraslog mahovinom kroz sunčanu livadu ispunjenu šarenim poljskim cvijećem.

Stvaranjem jasnog znaka s određenim detaljima u prvom upitu, isti se lik može smjestiti u potpuno novi kontekst u sljedećim upitima. Ovdje Gemini zadržava ključne karakterne značajke poput crta lica, jedinstvenog izgleda i odjeće.

Kako koristiti Gemini 2.5 Flash Image upite_2

Precizno izvršite lokalne pretvorbe

Ažurirana značajka uređivanja omogućuje brzu i točnu izmjenu određenih elemenata na slikama, pogodnu za scenarije kao što su prezentacija proizvoda ili osobna optimizacija fotografija:

Upit: Kvalitetna fotografija koja prikazuje moderan, minimalistički dnevni boravak sa sivim kaučem, stolićem od svijetlog drveta i velikom biljkom u saksiji.

Uredi (1): Promijenite boju kauča u tamnu tamnoplavu.
Uredi (2): Sada složite tri knjige jednu na drugu na stoliću za kavu.

Ovo pokazuje Geminijevu vještinu u lokalnoj montaži. Korištenjem izravnih, konverzacijskih naredbi moguće je modificirati određene elemente na slici bez potrebe za složenim softverom ili regeneracijom cijelih scena.

Spojite koncepte kroz kreativne kompozicije: Gemini mogu integrirati više koncepata u jednu sliku, stvarajući jedinstvene vizuale:

Upit 1: Generirajte realističnu fotografiju košarkaškog igrališta u prašumi obraslu biljkama.
Nadopuna upita: Neka Lakersi zakucavaju na ovom košarkaškom terenu.

Kako koristiti Gemini 2.5 Flash Image upite_3

Primijenite i prilagodite se novim stilovima

Kroz stilske prijenose, Gemini može sačuvati glavnu formu dok ponovno prikazuju različite umjetničke atmosfere za slike.

Upit: Realistična slika klasičnog motocikla parkiranog na gradskoj ulici.
Nadopuna upita: Primijenite ovu sliku u stilu arhitektonskog crteža.

Uz promjenu stila, Gemini može razumjeti temeljni predmet (motocikl) i njegov oblik, a zatim ga u potpunosti ponovno prikazati u željenom umjetničkom stilu. Ova metoda je idealna za inspiraciju dizajna, umjetničko stvaranje ili vizualno istraživanje.

Kako koristiti Gemini 2.5 Flash Image upite_4

Koristite logiku i rasuđivanje za složeno generiranje

Gemini razumije logiku stvarnog svijeta i predviđaju sljedeće zaplete na temelju konteksta:

Upit: Generiraj sliku osobe koja stoji s troslojnom tortom u rukama.
Nadopuna upita (u istom razgovoru): Generiraj sliku onoga što se događa kada se spotakne.

Na temelju stanja prve slike, model simulira vjerojatan ishod pada kolača, stvarajući dinamičnu i koherentnu novu sliku.

Kako koristiti Gemini 2.5 Flash Image upite_5

U ovoj fazi još uvijek postoje ograničenja upotrebe

Iako mnogi ljudi Gemini 2.5 nazivaju “artefaktom za retuširanje fotografija”, a neki čak vjeruju da bi u budućnosti mogao zamijeniti profesionalni softver poput Photoshopa, Google također podsjeća da ova tehnologija još uvijek ima neka ograničenja. Iako se dosljednost likova dosta poboljšala u usporedbi s prošlošću, još uvijek može doći do postupnog izobličenja izgleda likova nakon višestrukih uređivanja.

Osim toga, model još uvijek nije savršen u prikazivanju teksta, povremeno pogrešno piše riječi ili griješi kada se suoči sa složenom tipografijom. Što se tiče generiranja stilova, zbog nasumične prirode umjetne inteligencije, ona ponekad može proizvesti rezultate koji ne odgovaraju očekivanjima, a u smislu kontrole omjera slike, čak i ako se unesu jasni dimenzijski zahtjevi, konačni rezultati možda neće uvijek odgovarati postavkama.