গুগল জেমিনি আপগ্রেডে গুগল ডিপমাইন্ড কর্তৃক তৈরি "ন্যানো কলা" ইমেজ মডেল ব্যবহার করা হয়েছে। এই বৈশিষ্ট্যটি এখন বিশ্বব্যাপী বিনামূল্যে এবং অর্থপ্রদানকারী উভয় ব্যবহারকারীর জন্যই উপলব্ধ। এর সবচেয়ে বড় শক্তি হল ছবিতে মুখ এবং বস্তুর সামঞ্জস্য বজায় রাখার ক্ষমতা, যা অন্যান্য এআই টুলগুলি প্রায়শই মোকাবেলা করে।
"আমরা ছবির মান এবং মডেলের নির্দেশাবলী অনুসরণ করার ক্ষমতাকে সত্যিই উন্নত করেছি," ডিপমাইন্ডের প্রোডাক্ট লিড নিকোল ব্রিচটোভা বলেন। "এই আপডেটটি সম্পাদনাগুলিকে আরও নির্বিঘ্ন করে তোলে এবং ফলাফলগুলি যেকোনো উদ্দেশ্যে ব্যবহারের জন্য যথেষ্ট ভালো।"
প্রতিটি ছবিতে "তুমি" থাকো
AI ছবিগুলিকে নকল দেখানোর একটি কারণ হল ছোট ছোট বিবরণ বিকৃত করা। গুগল বলছে যে জেমিনি এই সমস্যার সমাধান করে, আপনাকে মুখ এবং অভিব্যক্তি একই রেখে পুরো দৃশ্য পরিবর্তন করতে দেয়। আপনি ছবির বিকৃতির বিষয়ে চিন্তা না করেই একটি নতুন চুলের স্টাইল চেষ্টা করতে পারেন, দেয়ালের রঙ পরিবর্তন করতে পারেন, অথবা কোনও পোষা প্রাণীকে দৃশ্যে আনতে পারেন।

জেমিনি আপনাকে একাধিক ছবি একত্রিত করে একটিতে আপলোড করার অনুমতি দেয়, যেমন আপনার বিড়ালের সাথে একটি প্রতিকৃতি একত্রিত করে রাস্তায় একসাথে বাইক চালানোর একটি ছবি তৈরি করা।
জেমিনি মাল্টি-টার্ন এডিটিং সাপোর্ট করে, যার ফলে ব্যবহারকারীরা একটি স্পেসে প্রতিটি বিবরণ যোগ করতে পারেন: ওয়ালপেপার, আসবাবপত্র থেকে শুরু করে রঙের রঙ পর্যন্ত। সুবিধাজনক দিক হল যে শুধুমাত্র যে অংশটি সম্পাদনা করা প্রয়োজন তা পরিবর্তিত হয়, বাকি অংশ একই থাকে।
এছাড়াও, জেমিনি ছবির মধ্যে স্টাইল মিশ্রিত করতে পারে। উদাহরণস্বরূপ, রেইন বুটকে ফ্লোরাল প্রিন্ট জুতাতে পরিণত করতে পারে, অথবা প্রজাপতির প্যাটার্নের পোশাক তৈরি করতে পারে।
প্রযুক্তি জায়ান্টদের মধ্যে এআই ইমেজ তৈরির প্রতিযোগিতা
গুগলের আপগ্রেডটি এআই ইমেজিং যুদ্ধের উত্তপ্ততার সাথে সাথে আসে। OpenAI পূর্বে GPT-4o চালু করেছিল, যা সরাসরি ছবি তৈরি করতে পারে এবং স্টুডিও ঘিবলি-স্টাইলের মিমের একটি সিরিজের মাধ্যমে ভাইরাল হয়েছিল। সিইও স্যাম অল্টম্যান প্রকাশ করেছেন যে ব্যবহারকারীর সংখ্যা এতটাই বেড়েছে যে কোম্পানির GPU গুলি "প্রায় গলে গেছে।"
সেই ধারাবাহিকতা ধরে রাখতে, মেটা মিডজার্নির সাথে একটি অংশীদারিত্ব ঘোষণা করেছে, যখন জার্মান স্টার্টআপ ব্ল্যাক ফরেস্ট ল্যাবস তার FLUX মডেলের সাথে অনেক চার্টে আধিপত্য বিস্তার করছে।

গুগল আশা করছে যে জেমিনি চ্যাটজিপিটির সাথে এই ব্যবধান কমাতে পারবে। সিইও সুন্দর পিচাইয়ের মতে, জেমিনির বর্তমানে ৪৫০ মিলিয়ন মাসিক ব্যবহারকারী রয়েছে, যা চ্যাটজিপিটির চেয়ে অনেক পিছিয়ে, যার সাপ্তাহিক ব্যবহারকারীর সংখ্যা ৭০০ মিলিয়নেরও বেশি।
ব্রিচটোভা বলেন, জেমিনি বাস্তব জগতের দৃশ্যপটের জন্য ডিজাইন করা হয়েছে, বসার ঘর এবং বাগানের দৃশ্যায়ন থেকে শুরু করে বিনোদনমূলক ছবি তৈরি করা পর্যন্ত। মডেলটির " বিশ্ব জ্ঞান" আরও ভালো এবং এটি একাধিক ছবি এবং রঙ প্যালেটকে একটি একক রেন্ডারিংয়ে একত্রিত করতে পারে।
তবে, গুগলও কঠোর বিধিনিষেধ আরোপ করে। সমস্ত তৈরি করা ছবির মেটাডেটাতে একটি স্পষ্ট ওয়াটারমার্ক এবং একটি সনাক্তকারী চিহ্ন লুকানো থাকে। ডিপফেক অপব্যবহার রোধ করার জন্য কোম্পানিটি অনুমতি ছাড়া সংবেদনশীল ছবি তৈরি কঠোরভাবে নিষিদ্ধ করে।
গুগল এর আগে জেমিনির ভুল ঐতিহাসিক চিত্রের জন্য ক্ষমা চেয়েছিল। এবার, কোম্পানিটি বিশ্বাস করে যে তারা সৃজনশীলতা এবং সুরক্ষার মধ্যে ভারসাম্য বজায় রেখেছে। "আমরা চাই ব্যবহারকারীরা সৃজনশীল হোক, কিন্তু সবকিছুই অনুমোদিত নয়," ব্রিচটোভা জোর দিয়ে বলেন।
জেমিনি ২.৫ ফ্ল্যাশ ইমেজের মাধ্যমে, গুগল এআই ফটো এডিটিং অভিজ্ঞতা উন্নত করার জন্য বাজি ধরছে, ওপেনএআই, মেটা এবং অন্যান্য প্রতিযোগীদের সাথে তীব্র প্রযুক্তি প্রতিযোগিতায় পুরানো ব্যবহারকারীদের ধরে রাখার এবং নতুনদের আকর্ষণ করার আশায়।
(টেকক্রাঞ্চ, টমস গাইড অনুসারে)

সূত্র: https://vietnamnet.vn/google-gemini-nang-tam-ai-tao-anh-doi-nen-kieu-toc-chi-bang-mot-cau-lenh-2436782.html
মন্তব্য (0)