Společnost Google DeepMind právě představila zásadní krok vpřed v oblasti generativní umělé inteligence (GenAI): model Gemini 2.5 Flash Image.
Tento model, komunitou láskyplně známý jako „Nano Banana“, je výkonný nástroj schopný transformovat text na obrázky a upravovat stávající obrázky s velkou přesností a flexibilitou.
Jedná se o pokračování modelové řady Gemini, ale je speciálně optimalizováno pro úlohy související s obrázky.

Díky vynikajícím výhodám v oblasti tvorby a úpravy fotografií přitahuje Nano Banana velkou pozornost globálních uživatelů technologií, včetně Vietnamu.
Podle Google Trends se za posledních 24 hodin prudce zvýšil počet vyhledávání výrazů Gemini a Nano Banana. Statistiky ze 4. září ukazují, že klíčové slovo „Gemini“ se umístilo na prvním místě žebříčku Trending ve všech tématech.
Na fórech a ve skupinách sociálních sítí uživatelé také sdílejí a testují příkazy a skripty pro tvorbu obrázků pomocí Nano Banana.
Většina lidí oceňuje schopnost nástroje vytvářet obrázky „rychle, úhledně a rychle“, stejně jako kvalitu výstupního produktu.
Gemini 2.5 Flash Image vyniká nejen pouhým vytvářením obrázků z textových popisů, ale i v několika klíčových aspektech: úpravou obrázků na vyžádání, konzistencí znaků, působivou rychlostí zpracování a bezpečnostní technologií SynthID.
Uživatelé mohou k úpravě prvků na fotografii použít přirozený jazyk. Stačí například zadat příkaz „přidat červenou židli vedle stolu“ nebo „změnit pozadí na les“ a model provede úpravu přesně a bez problémů.
Konzistence postavy je považována za nejprůlomovější vlastnost. Model si dokáže zapamatovat a znovu vytvořit obraz postavy nebo objektu s konzistentními rysy (jako je obličej, oblečení, styl) napříč více fotografiemi.
To je obzvláště užitečné pro kreativní projekty, které vyžadují vytvoření série souvisejících obrázků, od komiksů až po marketingové kampaně.
Díky optimalizované architektuře dokáže Gemini 2.5 Flash Image produkovat vysoce kvalitní výsledky během několika sekund, což výrazně urychluje kreativní pracovní postup.
Všechny obrázky vytvořené nebo upravené modelem jsou označeny proprietárním neviditelným digitálním vodoznakem od společnosti Google, který umožňuje rozpoznání obrázků vytvořených pomocí umělé inteligence a přispívá k zajištění transparentnosti a původu obsahu.
Model Gemini 2.5 Flash Image otevírá širokou škálu aplikačního potenciálu, od individuálních uživatelů až po profesionální vývojáře.
Vývojáři mohou k modelu přistupovat prostřednictvím rozhraní Gemini API a Google AI Studio a vytvářet si vlastní aplikace, zatímco podniky mohou model používat na platformě Vertex AI.
Pro průměrného uživatele je model integrován přímo do Google Gemini a dalších aplikací, což z umělé inteligence činí zobrazování přístupným a intuitivním nástrojem.
Díky svým vynikajícím funkcím, zejména schopnosti zachovat konzistenci znaků, se očekává, že se Gemini 2.5 Flash Image stane silným konkurentem tradičního softwaru pro úpravu fotografií, jako je Photoshop, a změní způsob, jakým tvůrci a uživatelé interagují s digitálními obrázky.

Zdroj: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html
Komentář (0)