أطلقت شركة جوجل للتو أداة جديدة للذكاء الاصطناعي تسمى "Whisk"، والتي تسمح للمستخدمين بتحميل الصور لاسترداد الصور المجمعة التي تم إنشاؤها بواسطة الذكاء الاصطناعي، حتى لو لم يدخل المستخدم أي نص.
يستخدم Whisk الذكاء الاصطناعي لدمج الموضوع والسياق وأسلوب الصورة التي تم تحميلها، مما يؤدي إلى إنشاء صورة جديدة وفريدة من نوعها.
تصف جوجل تطبيق Whisk بأنه "أداة إبداعية" تُساعد المستخدمين على توليد أفكار بصرية جديدة بسرعة دون الحاجة إلى مهارات احترافية في تحرير الصور. ووفقًا لجوجل، فإن الأداة ليست محرر صور تقليديًا، بل هي أداة ذكاء اصطناعي ممتعة تهدف إلى تحفيز الإبداع والاكتشاف السريع.
عندما يقوم المستخدم بتحميل صورة، يستخدم Whisk مزيجًا من خدمة الذكاء الاصطناعي من Google، وGemini، وتكنولوجيا Imagen 3 - وهي أداة تنشئ صورًا من نص حصلت عليه Google من DeepMind.
سيقوم برنامج Gemini بتحليل الصورة وإنشاء تعليق عليها، ثم سيقوم برنامج Imagen 3 بدمج عناصر تلك الصورة بطريقة إبداعية، مع الاحتفاظ بجوهر الموضوع بدلاً من نسخه بدقة.
واجهة أداة الخفق. لقطة شاشة
هذا يعني أن النتيجة النهائية قد لا تكون مطابقة تمامًا للصورة الأصلية. على سبيل المثال، قد يختلف طول الأشخاص في الصورة الجديدة، أو تسريحة شعرهم، أو لون بشرتهم عن الصورة الأصلية. مع ذلك، لا يزال بإمكان المستخدمين تعديل معلومات الإدخال، أو تغيير المشهد، أو النمط، أو دمج عدة أشخاص لإنشاء صور مختلفة.
يستطيع Whisk إنشاء صور ليس فقط من النصوص، بل أيضًا من الصور الخام، مما يُوسّع آفاق الإبداع دون الحاجة إلى خبرة سابقة في تحرير الصور. وصرح توماس إيلجيك، مدير إدارة المنتجات في مختبرات جوجل: "صُمم Whisk لمساعدة المستخدمين على إعادة مزج المواضيع والسياقات والأنماط بطرق إبداعية، مما يتيح لهم الاستكشاف البصري بدلًا من تحرير كل بكسل بدقة".
على الرغم من أن Whisk لا يزال في مراحله الأولى من التطوير، فقد تم إطلاق الأداة كموقع ويب على Google Labs وهي الآن متاحة للمستخدمين في الولايات المتحدة.
وقال دان إيفز، المدير الإداري وكبير المحللين في شركة ويدبوش للأوراق المالية، إن ويسك يمثل "لحظة أخرى من إظهار القوة" بالنسبة لجوجل في سباق التكنولوجيا.
أشار إيفز أيضًا إلى أن ديب مايند، مختبر الذكاء الاصطناعي الذي استحوذت عليه جوجل عام ٢٠١٤، يُعدّ ركيزةً أساسيةً في مساعدة جوجل على الحفاظ على مكانتها في مجال الذكاء الاصطناعي. وتُعدّ منتجات الذكاء الاصطناعي، بما فيها ويسك، جزءًا أساسيًا من استراتيجية جوجل لتطوير المنتجات في السنوات القادمة، مع توقع إطلاق العديد من المنتجات الجديدة بحلول عام ٢٠٢٥.
تفتح أداة Whisk آفاقًا جديدة لاستخدام الذكاء الاصطناعي لإنشاء منتجات إبداعية بأقل تدخل من المستخدم. وهذا يُظهر تقدم الذكاء الاصطناعي في فهم العناصر المرئية ودمجها بشكل إبداعي.
يُعد Whisk جزءًا من توجه متنامٍ بين شركات التكنولوجيا الكبرى، بما في ذلك Google وOpenAI، لتطوير أدوات ذكاء اصطناعي موجهة للمستهلكين تهدف إلى تمكين تجارب إبداعية جديدة، بدءًا من توليد الصور والنصوص ومقاطع الفيديو . كما أطلقت OpenAI مؤخرًا مُولّدًا لتحويل النصوص إلى مقاطع فيديو يُسمى Sora، والذي يُنافس Whisk مباشرةً.
نغوك آنه (وفقًا لشبكة CNN، وThe Verge، وZDNET)
[إعلان 2]
المصدر: https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html
تعليق (0)