(CLO) Google tocmai a lansat un nou instrument de inteligență artificială (IA) numit „Whisk”, care permite utilizatorilor să încarce fotografii pentru a recupera imagini combinate generate de inteligența artificială, chiar dacă utilizatorul nu introduce niciun text.
Whisk folosește inteligența artificială pentru a combina subiectul, contextul și stilul unei fotografii încărcate, creând o imagine nouă și mai unică.
Whisk este descris de Google ca un „instrument creativ” care ajută utilizatorii să genereze rapid idei vizuale noi, fără a necesita abilități profesionale de editare foto. Potrivit Google, instrumentul nu este un editor de imagini tradițional, ci mai degrabă un instrument distractiv bazat pe inteligență artificială, care își propune să stimuleze creativitatea și descoperirea rapidă.
Când un utilizator încarcă o fotografie, Whisk folosește o combinație între serviciul de inteligență artificială de la Google, Gemini și tehnologia Imagen 3 - un instrument care creează imagini din text pe care Google l-a achiziționat de la DeepMind.
Gemini va analiza fotografia și va crea o legendă, apoi Imagen 3 va combina elemente ale acelei fotografii într-un mod creativ, păstrând „esența” subiectului, în loc să o copieze exact.
Interfața instrumentului Tel. Captură de ecran
Aceasta înseamnă că rezultatul final poate să nu fie 100% identic cu imaginea originală. De exemplu, înălțimea, coafura sau nuanța pielii subiecților din noua imagine pot fi diferite de cele originale. Cu toate acestea, utilizatorii pot ajusta în continuare informațiile introduse, pot schimba scena, stilul sau pot combina mai mulți subiecți pentru a crea imagini diferite.
Whisk poate crea imagini nu doar din text, ci și din imagini brute, extinzând posibilitățile creative fără a necesita ca utilizatorii să aibă experiență în editarea fotografiilor. „Whisk este conceput pentru a ajuta utilizatorii să remixeze subiecte, contexte și stiluri în moduri creative, permițându-le să exploreze vizual, mai degrabă decât să editeze meticulos fiecare pixel”, a declarat Thomas Iljic, director de management de produs la Google Labs.
Deși Whisk se află în stadii incipiente de dezvoltare, instrumentul a fost lansat ca site web pe Google Labs și este acum disponibil utilizatorilor din SUA.
Dan Ives, director general și analist senior la Wedbush Securities, a declarat că Whisk marchează un alt „moment de demonstrație de forță” pentru Google în cursa tehnologică.
Ives a menționat, de asemenea, că DeepMind, laboratorul de inteligență artificială achiziționat de Google în 2014, este un atu cheie în menținerea poziției Google în domeniul inteligenței artificiale. Produsele de inteligență artificială, inclusiv Whisk, reprezintă o parte esențială a strategiei de dezvoltare a produselor Google în următorii ani, fiind așteptată lansarea mai multor produse noi până în 2025.
Instrumentul Whisk deschide noi căi pentru utilizarea inteligenței artificiale în crearea de produse creative cu intervenție minimă a utilizatorului. Acest lucru demonstrează progresul inteligenței artificiale în înțelegerea și combinarea creativă a elementelor vizuale.
Whisk face parte dintr-o tendință tot mai mare în rândul marilor companii de tehnologie, inclusiv Google și OpenAI, de a dezvolta instrumente de inteligență artificială orientate către consumatori, care își propun să permită noi experiențe creative, de la generarea de imagini, text și videoclipuri . OpenAI a introdus recent și un generator de text-video numit Sora, care concurează direct cu Whisk.
Ngoc Anh (conform CNN, The Verge, ZDNET)
Sursă: https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html
Comentariu (0)