Google DeepMind har nettopp introdusert et stort skritt fremover innen generativ kunstig intelligens (GenAI): Gemini 2.5 Flash Image-modellen.

Denne modellen, kjærlig kjent som «Nano Banana» av fellesskapet, er et kraftig verktøy som er i stand til å transformere tekst til bilder og redigere eksisterende bilder med stor presisjon og fleksibilitet.

Dette er en fortsettelse av Gemini-modellserien, men er spesielt optimalisert for bilderelaterte oppgaver.

c732a0fbdcce57900edf.jpg
Søkeordet Gemini toppet trendlisten på Google Trends i Vietnam 4. september. Skjermbilde.

Med enestående fordeler innen fotooppretting og redigeringsmuligheter tiltrekker Nano Banana seg stor oppmerksomhet fra globale teknologibrukere, inkludert Vietnam.

Ifølge Google Trends har søk etter Gemini og Nano Banana skutt i været de siste 24 timene. Statistikk fra 4. september viser at søkeordet «Gemini» toppet Trending-listen på tvers av alle emner.

På forum og sosiale nettverksgrupper deler og tester brukere også kommandoer og skript for bildeoppretting ved hjelp av Nano Banana.

De fleste setter pris på verktøyets evne til å lage bilder «raskt, pent og raskt», samt kvaliteten på resultatet.

Mer enn bare å lage bilder fra tekstbeskrivelser, utmerker Gemini 2.5 Flash Image seg på flere kjerneaspekter: bilderedigering på forespørsel, tegnkonsistens, imponerende behandlingshastighet og SynthID-sikkerhetsteknologi.

Brukere kan bruke naturlig språk for å endre elementer i et bilde. For eksempel, bare skriv inn kommandoen «legg til en rød stol ved siden av bordet» eller «endre bakgrunnen til en skog», så vil modellen gjøre redigeringen nøyaktig og sømløst.

Karakterkonsistens regnes som den mest banebrytende funksjonen. Modellen kan huske og gjenskape et bilde av en karakter eller et objekt med konsistente trekk (som ansikt, klær, stil) på tvers av flere bilder.

Dette er spesielt nyttig for kreative prosjekter som krever at man lager en serie relaterte bilder, fra tegneserier til markedsføringskampanjer.

Med sin optimaliserte arkitektur kan Gemini 2.5 Flash Image produsere resultater av høy kvalitet på sekunder, noe som akselererer den kreative arbeidsflyten betydelig.

Alle bilder som lages eller redigeres av modellen er merket med et proprietært, usynlig digitalt vannmerke fra Google, som tillater gjenkjenning av bilder laget med AI, og bidrar til å sikre åpenhet og opprinnelse til innholdet.

Gemini 2.5 Flash Image-modellen åpner opp for et bredt spekter av applikasjonspotensialer, fra individuelle brukere til profesjonelle utviklere.

Utviklere kan få tilgang til modellen via Gemini API og Google AI Studio for å bygge sine egne applikasjoner, mens bedrifter kan bruke modellen på Vertex AI-plattformen.

For den gjennomsnittlige brukeren er modellen innebygd direkte i Google Gemini og andre apper, noe som gjør AI-avbildning til et tilgjengelig og intuitivt verktøy.

Med sine enestående funksjoner, spesielt evnen til å opprettholde tegnkonsistens, forventes Gemini 2.5 Flash Image å bli en formidabel konkurrent til tradisjonell fotoredigeringsprogramvare som Photoshop, og endre måten skapere og brukere samhandler med digitale bilder.

Kina overgår uventet USA i den globale konkurransen om AI-oversettelse . Tencents åpen kildekode-modell Hunyuan-MT-7B (Kina) vant nesten fullstendig over de amerikanske «gigantene» i den internasjonale maskinoversettelseskonkurransen innenfor rammen av WMT25-konferansen.

Kilde: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html