পণ্যটি দ্রুত ভিয়েতনামী বিজ্ঞান ও প্রযুক্তি সম্প্রদায়ের মধ্যে ব্যাপক আলোড়ন সৃষ্টি করে।
ভিয়েতনামী সমস্যা সমাধানের জন্য কঠিন পথ বেছে নিন
২০২২ সালের শেষের দিকে, চ্যাটজিপিটি একটি "বিগ ব্যাং" তৈরি করে, প্রযুক্তি ক্ষেত্রে দেশ এবং জায়ান্টদের মধ্যে কৃত্রিম এআই জয়ের প্রতিযোগিতার সূচনা করে। সেই সময়ে, ভিয়েতনামী প্রযুক্তি সম্প্রদায়ও ভিয়েতনামী পণ্যগুলি প্রযুক্তিতে স্বয়ংসম্পূর্ণ হওয়ার জন্য, আন্তর্জাতিক পণ্যের উপর নির্ভরতা হ্রাস করার জন্য বিকাশ করতে আগ্রহী ছিল। তবে, প্রতিটি ইউনিটেরই ভিনবিগডাটার মতো সেই ইচ্ছা বাস্তবায়নের ক্ষমতা এবং দৃঢ় সংকল্প নেই।
"জেনারেটিভ এআই একটি কঠিন সমস্যা। ওপেনএআই বা গুগলের মতো বড় কোম্পানিগুলিকেও আমরা যেমন দেখি তেমন পণ্য তৈরি করতে সক্ষম হওয়ার জন্য গবেষণায় প্রচুর সম্পদ এবং সময় ব্যয় করতে হয়। এই পণ্যগুলি খুব ভালো, কিন্তু বাস্তবে, বিজ্ঞানীরা এখনও এর অপারেটিং মেকানিজম পুরোপুরি বুঝতে পারেন না। কখন এতে ত্রুটি থাকবে এবং ত্রুটিগুলি কী হবে, তা খুব কম লোকই ভবিষ্যদ্বাণী করতে পারে। এক বছরেরও কম সময়ের মধ্যে ভিয়েতনামী জনগণের জন্য চ্যাটজিপিটির অনুরূপ একটি পণ্য তৈরি করা অনেক চ্যালেঞ্জের। কিন্তু আমরা "ঝুঁকি" বেছে নিয়েছি কারণ যদি চ্যাটজিপিটির একটি ভিয়েতনামী সংস্করণ ভিয়েতনামী লোকেরা তৈরি না করে, তাহলে কে এটি তৈরি করবে?" - ভিনবিগডাটার বিজ্ঞান পরিচালক অধ্যাপক ভু হা ভ্যান শেয়ার করেছেন।
আসলে, খুব কম কোম্পানিই তাদের নিজস্ব বৃহৎ ভাষা মডেল তৈরি করতে পছন্দ করে। উদাহরণস্বরূপ, OpenAI-এর GPT 3-এর 175 বিলিয়ন প্যারামিটার রয়েছে এবং এটি 45 টেরাবাইট ডেটাসেটের উপর প্রশিক্ষিত ছিল এবং এর খরচ ছিল $4.6 মিলিয়ন। গণনা অনুসারে, GPT 4 তৈরি করতে খরচ এমনকি $100 মিলিয়ন পর্যন্ত হতে পারে। "এত বিশাল সংখ্যার সাথে, এই প্রযুক্তিতে বিনিয়োগ করার সামর্থ্য রাখে এমন একটি কোম্পানি খুঁজে পাওয়া খুব কঠিন," বলেছেন VinBigdata-এর পণ্য পরিচালক ডঃ নগুয়েন কিম আন।
ভিয়েতনামী ব্যবসাগুলিকে সর্বোত্তম খরচ এবং অবকাঠামো সহ নতুন প্রজন্মের AI প্রযুক্তি অ্যাক্সেস করার জন্য, VinBigdata সম্পূর্ণ ভিন্ন দিক বেছে নিয়েছে, যা হল মাত্র 1.6 বিলিয়ন প্যারামিটার সহ একটি ভাষা মডেল তৈরি করা, কিন্তু বিলিয়ন প্যারামিটার সহ বৃহৎ ভাষা মডেলের সমতুল্য ক্ষমতা সহ। "ফলাফলগুলি দেখায় যে VinBigdata নিজেই তৈরি করা স্থাপত্যের সাহায্যে, ভাষা মডেল প্রশিক্ষণ প্রক্রিয়াটি অপ্টিমাইজ করা এবং ত্বরান্বিত করা, অবকাঠামোগত খরচ (প্রশিক্ষণ খরচ এবং ব্যবহারের খরচ সহ) হ্রাস করা সম্পূর্ণরূপে সম্ভব, তবে তবুও মডেলের গুণমান নিশ্চিত করা সম্ভব", ডঃ নগুয়েন কিম আনহ যোগ করেছেন।
বৃহৎ ভাষার মডেল আকারের সমস্যা সমাধানের পর, ViGPT "ধারণা" দেওয়ার প্রক্রিয়া চলাকালীন, বিদেশী মডেলগুলি অধ্যয়ন করার পর, VinBigdata টিম আরেকটি চ্যালেঞ্জও উপলব্ধি করে: "ভ্রম", যা পরিসংখ্যানগত সম্ভাব্যতা মডেলগুলির অন্তর্নিহিত প্রকৃতি থেকে আসে।
অতএব, বিশ্বের বৃহত্তম ভাষা মডেলগুলিকে প্রায়শই ইংরেজি তথ্য উৎস দিয়ে প্রশিক্ষণ দেওয়া হয়। অতএব, এই মডেলটি ভিয়েতনামী জনগণের প্রেক্ষাপট এবং সংস্কৃতি সঠিকভাবে বুঝতে এবং প্রতিক্রিয়া জানাতে পারে না। এর ফলে একটি হ্যালুসিনেশন তৈরি হয় যার ফলে বৃহৎ ভাষা মডেলগুলি ভুল উত্তর "বানোয়াট" করে।
স্বল্পতম সময়ের মধ্যে সর্বোত্তম সমাধান খুঁজে বের করার জন্য, VinBigdata-এর ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং (NLP) টিমকে ছোট ছোট দলে বিভক্ত করা হয়েছিল, যারা সবচেয়ে উপযুক্ত চূড়ান্ত দিকনির্দেশনা খুঁজে পেতে বিভিন্ন ধারণা বিশ্লেষণ এবং আলোচনা করেছিল।
"অবশেষে, আমরা বেশিরভাগ বর্তমান বৃহৎ ভাষা মডেল থেকে একটি ভিন্ন স্থাপত্য তৈরি করার সিদ্ধান্ত নিয়েছি, এবং 600GB সূক্ষ্ম-সুরক্ষিত ভিয়েতনামী ডেটা সেটের উপর প্রশিক্ষণ পরিচালনা করার সিদ্ধান্ত নিয়েছি, যাতে ভিয়েতনামী জনগণের প্রেক্ষাপট বুঝতে এবং উত্তর দিতে সক্ষম একটি "বুদ্ধিমান ভার্চুয়াল সহকারী" তৈরি করা যায়," ডঃ নগুয়েন কিম আনহ যোগ করেছেন।
ভিয়েতনামী প্রযুক্তি বাস্তুতন্ত্রের আকাঙ্ক্ষা
ভিয়েতনামী ভাষা দক্ষতা মূল্যায়ন মান (VMLU) থেকে মূল্যায়নের ফলাফল অনুসারে, ViGPT গড়ে ৪২.২৪% স্কোর অর্জন করেছে, যা ChatGPT (৪৮.৫৪%) এর পরে দ্বিতীয়। এই ফলাফল ViGPT কে দ্রুত তথ্য অনুসন্ধান করতে এবং ভিয়েতনামের নির্দিষ্ট এবং নির্দিষ্ট বিষয় সম্পর্কে প্রশ্নের উত্তর দিতে সাহায্য করে।
ভার্চুয়াল সহকারীর ক্ষমতা ছাড়াও, ডেভেলপমেন্ট টিম যা চায় তা হল ভিয়েতনামী জনগণের জীবনে পরিবর্তন আনার জন্য ViGPT-কে পরিচিত, দৈনন্দিন পণ্যের সাথে একীভূত করা। এটিই সেই চালিকা শক্তি যা VinBigdata টিমকে ViGPT প্রয়োগকারী ভাষা এবং ভয়েস পণ্যের একটি ইকোসিস্টেম তৈরি করতে অনুপ্রাণিত করে - "Vi" ইকোসিস্টেমের মধ্যে রয়েছে: ViChat, ViVoice, ViVi ভার্চুয়াল অ্যাসিস্ট্যান্ট। এই পণ্যগুলি অনেক শিল্পে ব্যবহার করা যেতে পারে, স্বয়ংচালিত শিল্প, ব্যাংকিং - অর্থ, বীমা থেকে পরিবহন এবং অন্যান্য অনেক ক্ষেত্রে।
"প্রযুক্তি, বিশেষ করে AI নিয়ে কাজ করার সময়, আমরা কেবল আকর্ষণীয়, জটিল সিস্টেমগুলিকে জয় করতে চাই না যা দেখতে কঠিন। আমরা বাস্তব, অত্যন্ত প্রযোজ্য পণ্য তৈরি করতে চাই, যেখানে AI হল সরাসরি এজেন্ট যা জীবনে পরিবর্তন আনে," ভিনবিগডাটা প্রোডাক্ট ডিরেক্টর নিশ্চিত করেছেন।
অতএব, ViGPT-এর সফল বিকাশ লক্ষ লক্ষ ভিয়েতনামী মানুষের জীবনযাত্রার জন্য "বিশুদ্ধ ভিয়েতনামী" প্রযুক্তি এবং ডেটা আনার যাত্রার প্রথম ধাপ মাত্র। VinBigdata-এর একজন প্রতিনিধি বলেছেন যে এই ইউনিটের লক্ষ্য হল ViGPT-কে VinBase 2.0 মাল্টি-কগনিটিভ কৃত্রিম বুদ্ধিমত্তা প্ল্যাটফর্মের সাথে একীভূত করা, যাতে বিভিন্ন আকার এবং শিল্পের সংস্থা এবং ব্যবসার জন্য উন্নত সমাধান প্রদান করা যায়।
ViGPT-এর আগে, ভাষা ও বক্তৃতা প্রক্রিয়াকরণ প্রযুক্তির ক্ষেত্রে বিশেষজ্ঞ এবং প্রকৌশলীদের দল VinBigdata ViVi চালু করে তার চিহ্ন তৈরি করেছিল - প্রথম ব্যাপক ভিয়েতনামী ভার্চুয়াল সহকারী ( VinFast বৈদ্যুতিক গাড়ি, Vinhomes রেসিডেন্ট অ্যাপ্লিকেশন এবং Vinhomes অনলাইন ই-কমার্স প্ল্যাটফর্মে প্রয়োগ এবং স্থাপন করা), একই সাথে, ভয়েস বায়োমেট্রিক্স বা ভয়েস ক্লোনিংয়ের মতো বিশ্বের সবচেয়ে উন্নত প্রযুক্তিগুলিতে সম্পূর্ণরূপে দক্ষতা অর্জন করে।
এই সমস্ত প্রযুক্তি ৩,৫০০ টেরাবাইট ডাটাবেসের উপর ভিত্তি করে তৈরি করা হয়েছে, যা মূলত ভিয়েতনামী-নির্দিষ্ট ডেটার উপর দৃষ্টি নিবদ্ধ করে, যা ভিনবিগডাটা দ্বারা সংগৃহীত, বিশ্লেষণ এবং পরিমার্জিত করা হয়েছে। চূড়ান্ত লক্ষ্য হল ভিয়েতনামী তথ্য এবং জ্ঞান ব্যবস্থা ব্যবহার করে ভিয়েতনামী জীবনে বিশ্ব প্রযুক্তি নিয়ে আসা।
ViGPT হল VinBigdata দ্বারা তৈরি ভিয়েতনামী বৃহৎ ভাষা মডেল (LLM) এর উপর ভিত্তি করে তৈরি শেষ ব্যবহারকারীদের জন্য "চ্যাটজিপিটি-র প্রথম ভিয়েতনামী সংস্করণ"। ViGPT-এর অসাধারণ বৈশিষ্ট্য রয়েছে এবং এটি ভিয়েতনামী জনগণের চাহিদা যেমন কন্টেন্ট তৈরি, তথ্য অনুসন্ধান এবং ভিয়েতনামের সাধারণ প্রশ্নের উত্তর দেওয়ার জন্য সর্বোত্তমভাবে ডিজাইন করা হয়েছে। নিবন্ধন করুন এবং ViGPT-এর অভিজ্ঞতা নিন: vigpt.vinbigdata.com |
থান হা
[বিজ্ঞাপন_২]
উৎস
মন্তব্য (0)