(CLO) Google baru sahaja melancarkan alat kecerdasan buatan (AI) baharu yang dipanggil "Whisk", membenarkan pengguna memuat naik foto untuk mendapatkan imej gabungan yang dijana AI, walaupun pengguna tidak memasukkan sebarang teks.
Whisk menggunakan AI untuk menggabungkan subjek, konteks dan gaya foto yang dimuat naik, mencipta imej baharu dan lebih unik.
Whisk diterangkan oleh Google sebagai "alat kreatif" yang membantu pengguna menjana idea visual baharu dengan cepat tanpa memerlukan kemahiran penyuntingan foto profesional. Menurut Google, alat itu bukan editor imej tradisional, sebaliknya alat AI yang menyeronokkan yang bertujuan untuk mencetuskan kreativiti dan penemuan pantas .
Apabila pengguna memuat naik foto, Whisk menggunakan gabungan perkhidmatan AI Google, Gemini dan teknologi Imagen 3 — alat yang mencipta imej daripada teks yang diperoleh Google daripada DeepMind.
Gemini akan menganalisis foto dan mencipta kapsyen, kemudian Imagen 3 akan menggabungkan unsur-unsur foto itu dengan cara yang kreatif, mengekalkan "intipati" subjek dan bukannya menyalinnya dengan tepat.
Antara muka alat pukul. Tangkapan skrin
Ini bermakna hasil akhir mungkin tidak 100% sama dengan imej asal. Contohnya, ketinggian, gaya rambut atau ton kulit subjek dalam imej baharu mungkin berbeza daripada yang asal. Walau bagaimanapun, pengguna masih boleh melaraskan maklumat input, menukar pemandangan, gaya atau menggabungkan berbilang subjek untuk mencipta imej yang berbeza.
Whisk boleh mencipta imej bukan sahaja daripada teks tetapi juga daripada imej mentah, mengembangkan kemungkinan kreatif tanpa memerlukan pengguna untuk mempunyai sebarang pengalaman mengedit foto. "Whisk direka bentuk untuk membantu pengguna mengadun semula subjek, konteks dan gaya dengan cara yang kreatif, membolehkan mereka meneroka secara visual dan bukannya mengedit setiap piksel dengan teliti," kata Thomas Iljic, pengarah pengurusan produk di Google Labs.
Walaupun Whisk berada di peringkat awal pembangunannya, alat ini telah dilancarkan sebagai tapak web di Google Labs dan kini tersedia kepada pengguna di AS.
Dan Ives, pengarah urusan dan penganalisis kanan di Wedbush Securities, berkata Whisk menandakan satu lagi "detik kekuatan" untuk Google dalam perlumbaan teknologi.
Ives juga menyatakan bahawa DeepMind, makmal AI yang diperoleh Google pada 2014, merupakan aset utama dalam membantu Google mengekalkan kedudukannya dalam ruang AI. Produk AI, termasuk Whisk, merupakan bahagian penting dalam strategi pembangunan produk Google pada tahun-tahun akan datang, dengan beberapa produk baharu dijangka dilancarkan menjelang 2025.
Alat Whisk membuka ruang baharu untuk menggunakan AI untuk mencipta produk kreatif dengan campur tangan pengguna yang minimum. Ini menunjukkan kemajuan AI dalam memahami dan menggabungkan elemen visual secara kreatif.
Whisk adalah sebahagian daripada trend yang semakin berkembang dalam kalangan syarikat teknologi utama, termasuk Google dan OpenAI, untuk membangunkan alatan AI yang dihadapi pengguna yang bertujuan untuk membolehkan pengalaman kreatif baharu, daripada menjana imej, teks dan video . OpenAI juga baru-baru ini memperkenalkan penjana teks-ke-video yang dipanggil Sora, yang bersaing secara langsung dengan Whisk.
Ngoc Anh (menurut CNN, The Verge, ZDNET)
Sumber: https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html
Komen (0)