Vietnam.vn - Nền tảng quảng bá Việt Nam

أدوات الذكاء الاصطناعي لتحويل الكلام إلى نص "تسيء تمثيل" أيضًا

Công LuậnCông Luận29/10/2024

يتم الإعلان عن أداة تحويل الكلام إلى نص Whisper من OpenAI على أنها "قوية ودقيقة على مستوى الإنسان تقريبًا"، ولكن لديها عيب رئيسي واحد: إنها عرضة لتزييف أجزاء نصية أو حتى جمل كاملة!


ويقول الخبراء إن بعض النصوص التي تنتجها، والمعروفة في هذه الصناعة باسم النصوص المهلوسة، يمكن أن تتضمن تعليقات عنصرية، وعنفًا، وحتى علاجات طبية خيالية.

ويقول الخبراء إن مثل هذه التلفيقات خطيرة لأن Whisper يستخدم في مجموعة واسعة من الصناعات في جميع أنحاء العالم لترجمة ونسخ المقابلات وإنشاء النصوص ومقاطع الفيديو المصاحبة.

والأمر الأكثر إثارة للقلق هو أن المراكز الطبية تستخدم أدوات تعتمد على Whisper لتسجيل استشارات المرضى والأطباء، على الرغم من تحذير OpenAI من أنه لا ينبغي استخدام الأداة في "المناطق عالية الخطورة".

أداة تحويل الكلام إلى نص يمكن لأي شخص التعامل مع الصورة 1

الجمل التي تبدأ بـ "#الحقيقة_الجوهرية" هي ما قيل بالفعل، أما الجمل التي تبدأ بـ "#نص" فهي ما نقله ويسبر. الصورة: أسوشيتد برس

يقول باحثون ومهندسون إن جهاز ويسبر يُسبب هلوسات متكررة أثناء استخدامه. على سبيل المثال، قال باحث من جامعة ميشيغان إنه وجد هلوسات في ثمانية من أصل عشرة تسجيلات فحصها.

اكتشف أحد مهندسي التعلم الآلي الأوائل التلاعب في حوالي نصف نصوص ويسبر التي حللها، والتي تجاوزت مئة ساعة. وقال مطور ثالث إنه وجد هذا الوهم في كل نص تقريبًا من النصوص الستة والعشرين ألفًا التي أُنشئت باستخدام ويسبر.

يستمر هذا الوهم حتى في عينات صوتية قصيرة ومُسجلة جيدًا. وقد وجدت دراسة حديثة أجراها علماء حاسوب 187 تشويهًا في أكثر من 13,000 مقطع صوتي واضح فحصوه.

وقال الباحثون إن هذا الاتجاه من شأنه أن يؤدي إلى عشرات الآلاف من الأخطاء عبر ملايين التسجيلات.

وقالت ألوندرا نيلسون، أستاذة في كلية العلوم الاجتماعية في معهد الدراسات المتقدمة، إن مثل هذه الأخطاء يمكن أن يكون لها "عواقب وخيمة حقًا"، خاصة في بيئة المستشفى.

لا أحد يرغب في أن يُشخَّص خطأً. يجب أن يكون هناك حاجز أعلى، كما قال نيلسون.

قامت أستاذتا جامعة كورنيل، أليسون كوينيكي ومونا سلون من جامعة فرجينيا، بفحص آلاف المقتطفات القصيرة التي استرجعتاها من "توك بانك"، وهو أرشيف بحثي تستضيفه جامعة كارنيجي ميلون. وخلصتا إلى أن ما يقرب من 40% من الهلوسات كانت ضارة أو مزعجة، لأن المتحدث قد يُساء فهمه أو يُحريف تمثيله.

في أحد التسجيلات، وصف أحد المتحدثين "فتاتين أخريين وامرأة"، لكن ويسبر اختلق تعليقًا عنصريًا إضافيًا، مضيفًا "فتاتين أخريين وامرأة، سوداء".

في نسخة أخرى، اخترع ويسبر دواءً غير موجود يُسمى "المضادات الحيوية ذات النشاط المتزايد".

في حين يفترض معظم المطورين أن أدوات النسخ يمكن أن ترتكب أخطاء إملائية أو أخطاء أخرى، يقول المهندسون والباحثون إنهم لم يروا أبدًا أداة نسخ مدعومة بالذكاء الاصطناعي تسبب الهلوسة مثل Whisper.

تم دمج هذه الأداة في عدة إصدارات من برنامج ChatGPT، روبوت الدردشة الرائد من OpenAI، وهي خدمة متكاملة في منصات الحوسبة السحابية من Oracle وMicrosoft، تخدم آلاف الشركات حول العالم. كما تُستخدم لنسخ النصوص وترجمتها إلى العديد من اللغات.

نغوك آنه (وفقًا لوكالة أسوشيتد برس)


[إعلان 2]
المصدر: https://www.congluan.vn/cong-cu-chuyen-giong-noi-thanh-van-ban-ai-cung-co-the-xuyen-tac-post319008.html

تعليق (0)

No data
No data

نفس الموضوع

نفس الفئة

صباحات هادئة على شريط الأرض على شكل حرف S
الألعاب النارية تنفجر، والسياحة تتسارع، ودا نانغ تسجل نجاحًا في صيف 2025
استمتع بصيد الحبار الليلي ومشاهدة نجم البحر في جزيرة اللؤلؤ فو كوك
اكتشف عملية صنع أغلى أنواع شاي اللوتس في هانوي

نفس المؤلف

إرث

شكل

عمل

No videos available

أخبار

النظام السياسي

محلي

منتج