টেক জায়ান্ট ওপেনএআই তাদের স্পিচ-টু-টেক্সট টুল হুইস্পারকে "মানুষের মতো নির্ভুলতা এবং দৃঢ়তা" সহ একটি এআই হিসেবে প্রচার করেছে। কিন্তু হুইস্পারের একটি বড় ত্রুটি রয়েছে: এটি সম্পূর্ণরূপে ভুয়া টেক্সট এবং বাক্য তৈরি করে।
কৃত্রিম বুদ্ধিমত্তা (এআই) দ্বারা তৈরি কিছু লেখা - যাকে "হ্যালুসিনেশন" বলা হয় - তার মধ্যে বর্ণবাদী মন্তব্য, হিংসাত্মক ভাষা এবং এমনকি কাল্পনিক চিকিৎসাও অন্তর্ভুক্ত থাকতে পারে — ছবি: এপি
এপি অনুসারে, এআই-উত্পাদিত কিছু লেখা অবাস্তব, যাকে "ভ্রান্ত ধারণা" বলা হয়, এবং এতে বর্ণগত মন্তব্য, হিংসাত্মক ভাষা এবং এমনকি কাল্পনিক চিকিৎসাও অন্তর্ভুক্ত রয়েছে।
কৃত্রিম বুদ্ধিমত্তা-নির্ভর লেখাগুলিতে "বিভ্রমের" উচ্চ হার
বিশেষজ্ঞরা বিশেষভাবে উদ্বিগ্ন কারণ হুইস্পার বিশ্বজুড়ে অনেক শিল্পে সাক্ষাৎকার অনুবাদ এবং প্রতিলিপি তৈরি করতে, জনপ্রিয় ভোক্তা প্রযুক্তিতে পাঠ্য তৈরি করতে এবং ভিডিওর জন্য সাবটাইটেল তৈরি করতে ব্যাপকভাবে ব্যবহৃত হয়।
আরও উদ্বেগজনকভাবে, অনেক চিকিৎসা কেন্দ্র ডাক্তার এবং রোগীদের মধ্যে পরামর্শ স্থানান্তর করার জন্য হুইস্পার ব্যবহার করছে, যদিও ওপেনএআই সতর্ক করে দিয়েছে যে "উচ্চ ঝুঁকিপূর্ণ" এলাকায় এই সরঞ্জামটি ব্যবহার করা উচিত নয়।
সমস্যার সম্পূর্ণ ব্যাপ্তি নির্ধারণ করা কঠিন, তবে গবেষক এবং প্রকৌশলীরা বলছেন যে তারা নিয়মিতভাবে তাদের কাজে হুইস্পার "হ্যালুসিনেশন" এর সম্মুখীন হন।
মিশিগান বিশ্ববিদ্যালয়ের একজন গবেষক বলেছেন যে তিনি দশটি অডিও ট্রান্সক্রিপশনের মধ্যে আটটিতে "হ্যালুসিনেশন" পেয়েছেন। একজন কম্পিউটার ইঞ্জিনিয়ার ১০০ ঘন্টারও বেশি অডিও ট্রান্সক্রিপশন বিশ্লেষণ করে প্রায় অর্ধেকের মধ্যে "হ্যালুসিনেশন" পেয়েছেন। আরেকজন ডেভেলপার বলেছেন যে তিনি হুইস্পার ব্যবহার করে তৈরি করা ২৬,০০০ রেকর্ডিংয়ের প্রায় সবকটিতেই "হ্যালুসিনেশন" পেয়েছেন।
ছোট, স্পষ্টভাবে রেকর্ড করা অডিও নমুনার ক্ষেত্রেও এই সমস্যাটি রয়ে গেছে। কম্পিউটার বিজ্ঞানীদের সাম্প্রতিক এক গবেষণায় ১৩,০০০ এরও বেশি স্পষ্ট অডিও ক্লিপে ১৮৭টি "ভ্রম" পাওয়া গেছে যা তারা পরীক্ষা করেছেন। গবেষকরা বলেছেন যে এই প্রবণতা লক্ষ লক্ষ রেকর্ডিংয়ে হাজার হাজার মিথ্যা ট্রান্সক্রিপশনের দিকে পরিচালিত করবে।
গত বছর পর্যন্ত বাইডেন প্রশাসনে হোয়াইট হাউস অফিস অফ সায়েন্স অ্যান্ড টেকনোলজির প্রধান অ্যালোন্ড্রা নেলসনের মতে, এই ধরনের ত্রুটির "খুব গুরুতর পরিণতি" হতে পারে, বিশেষ করে হাসপাতালের পরিবেশে।
"কেউই ভুল রোগ নির্ণয় চায় না," বলেছেন নেলসন, যিনি এখন নিউ জার্সির প্রিন্সটনের ইনস্টিটিউট ফর অ্যাডভান্সড স্টাডির অধ্যাপক। "একটি উচ্চতর মান থাকা দরকার।"
বধির এবং শ্রবণশক্তিহীনদের জন্য ক্যাপশন তৈরি করতেও হুইস্পার ব্যবহার করা হয় - এমন একটি জনগোষ্ঠী যারা বিশেষ করে ভুল অনুবাদের ঝুঁকিতে থাকে। এর কারণ হল বধির এবং শ্রবণশক্তিহীনদের কাছে "অন্যান্য সমস্ত পাঠ্যের মধ্যে লুকানো" বানোয়াট অনুচ্ছেদগুলি সনাক্ত করার কোনও উপায় নেই, গ্যালাউডেট বিশ্ববিদ্যালয়ের প্রযুক্তি অ্যাক্সেসিবিলিটি প্রোগ্রামের পরিচালক এবং বধির ক্রিশ্চিয়ান ভোগলার বলেছেন।
সমস্যা সমাধানের জন্য OpenAI-কে আহ্বান জানানো হচ্ছে
এই ধরনের "হ্যালুসিনেশন"-এর ব্যাপকতা বিশেষজ্ঞ, সমর্থক এবং প্রাক্তন ওপেনএআই কর্মচারীদের ফেডারেল সরকারের কাছে এআই নিয়মকানুন বিবেচনা করার আহ্বান জানিয়েছে। অন্ততপক্ষে, ওপেনএআই-এর এই ত্রুটিটি সমাধান করা উচিত।
"কোম্পানি যদি এটিকে অগ্রাধিকার দিতে ইচ্ছুক হয় তবে এই সমস্যাটি সমাধানযোগ্য," বলেছেন সান ফ্রান্সিসকোর একজন গবেষণা প্রকৌশলী উইলিয়াম সন্ডার্স, যিনি কোম্পানির দিকনির্দেশনা নিয়ে উদ্বেগের কারণে ফেব্রুয়ারিতে OpenAI ত্যাগ করেছিলেন।
"এটি একটি সমস্যা, যদি আপনি এটি প্রকাশ করেন এবং লোকেরা এটি কী করতে পারে সে সম্পর্কে এতটাই আত্মবিশ্বাসী হয়ে ওঠে যে তারা এটিকে অন্যান্য সমস্ত সিস্টেমের সাথে একীভূত করে," একজন OpenAI মুখপাত্র বলেছেন। কোম্পানিটি এই "ভ্রম" প্রশমিত করার উপায় নিয়ে ক্রমাগত কাজ করছে এবং গবেষকদের অনুসন্ধানকে মূল্য দেয়, যোগ করে যে OpenAI মডেল আপডেটগুলিতে প্রতিক্রিয়া অন্তর্ভুক্ত করে।
যদিও বেশিরভাগ ডেভেলপার ধরে নেন যে টেক্সট-টু-স্পিচ ইঞ্জিনগুলি টাইপিং বা অন্যান্য ভুল করতে পারে, প্রকৌশলী এবং গবেষকরা বলছেন যে তারা কখনও এমন AI-চালিত টেক্সট-টু-স্পিচ ইঞ্জিন দেখেননি যা হুইস্পারের মতো "হ্যালুসিনেট" করে।
[বিজ্ঞাপন_২]
সূত্র: https://tuoitre.vn/cong-cu-ai-chuyen-loi-noi-thanh-van-ban-cua-openai-bi-phat-hien-bia-chuyen-20241031144507089.htm
মন্তব্য (0)