الميزة الأبرز في VASA-1 هي أنه يتيح للمستخدمين تحريك أي صورة. يمكنهم التقاط صورة لشخص ما وجعله يتحرك ويتحدث ويغني بشكل معبر. المثير للاهتمام في هذا الحل الذكي هو مستوى الواقعية العالي الذي يوفره.
يمكن لـVASA-1 جعل الصور أكثر وضوحًا
يُركز حل VASA-1 على تحسين إمكانية الوصول للأشخاص الذين يعانون من صعوبات في التواصل. ويسعى إلى توفير الرفقة أو الدعم العلاجي لمن يحتاجون إليه، مما يسمح بإنشاء وجوه ناطقة واقعية في الوقت الفعلي. يتطلب VASA-1 فقط صورة لوجه الشخص الذي يُراد إضافة صوت إليه. كما يسمح للمستخدمين بإضافة عناصر أخرى لجعل الصور أكثر واقعية. ويمكنهم أيضًا تعديل وضعية العينين أو حركة الفم، مما يجعل الوجه يبتسم أو يصرخ.
وتؤكد مايكروسوفت على مدى واقعية وواقعية مقاطع الفيديو هذه التي يتم إنشاؤها من صورة الشخص، ولكن الأمر لا يقتصر فقط على القدرة على إضافة الصوت والحركات السهلة والواقعية إلى الرسومات أو الفن، حيث يتمتع VASA-1 بالقدرة على إضافة المشاعر وتعبيرات الوجه والقدرة على إضافة الحركة إلى الرأس.
لن يتم إطلاق VASA-1 للعامة.
مع ذلك، وكما هو الحال مع سورا من OpenAI، تُحذّر مايكروسوفت من أن VASA-1 لن يكون متاحًا، إذ لن تُصدر أي عروض تجريبية أو واجهات برمجة تطبيقات أو منتجات أو خدمات متعلقة به. يُحتمل أن يكون هذا مجرد الإصدار الأول من هذه التقنية الجديدة، وأنه لا يزال في مرحلة التطوير، وتشعر مايكروسوفت بالقلق من خطر استخدام التزييف العميق لأغراض خبيثة. لذلك، يبدو أنه يُستخدم فقط بموجب اتفاقيات مع مراكز متخصصة تعمل مع الأشخاص الذين يعانون من مشاكل تواصل مختلفة.
ربما سيتم نشر VASA-1 مستقبلًا، ولكن بطريقة مُحكمة لتجنب المشاكل. يستهدف VASA-A المؤسسات العامة القادرة على إنشاء مساعدين افتراضيين أسهل استخدامًا، كما يُمكن أن يُضيف ميزة إضافية لبرنامج Copilot، لإنشاء مساعد افتراضي قريب من نظام Windows.
ومع ذلك، حتى لو حدث ذلك، فإن مايكروسوفت تشعر بقلق بالغ بشأن مشكلات الأمان لتجنب استغلالها لاستخدام المنصة في عمليات الاحتيال أو تشجيع الاستثمار في الأنشطة الاحتيالية.
[إعلان 2]
رابط المصدر
تعليق (0)