ডঃ দাও ডাক মিন: 'ভিয়েতনামী তথ্য আয়ত্ত করা হল ভিয়েতনামী প্রযুক্তির বিকাশ এবং আয়ত্তের প্রথম ধাপ'
Báo Thanh niên•27/05/2024
মার্কিন যুক্তরাষ্ট্রে একটি বৃহৎ কৃত্রিম বুদ্ধিমত্তা সংস্থায় কাজ করার পর, কেন আপনি ভিনবিগডেটাতে যোগদানের জন্য ভিয়েতনামে ফিরে যাওয়ার সিদ্ধান্ত নিলেন? মার্কিন যুক্তরাষ্ট্রে কাজ করার সময়, যদিও আমি অনেক বৃহৎ সরকারি প্রকল্পে অংশগ্রহণ করেছি, আমি যে ফলাফল অর্জন করেছি তা প্রায়শই একটি বৃহৎ প্রক্রিয়াকরণ প্রক্রিয়ার মাত্র কয়েকটি ধাপ ছিল। অনেক সময়, প্রকল্পগুলির অত্যন্ত কঠোর গোপনীয়তা পদ্ধতির কারণে, আমি জানতাম না যে আমি যে সমাধানগুলি তৈরি করেছি তা কীভাবে ব্যবহার করা হচ্ছে। 2017 সালে, আমি ভিয়েতনামে ফিরে আসি যখন ভিয়েতনাম উন্নয়নের পর্যায়ে ছিল এবং বৃহৎ ডেটা এবং কৃত্রিম বুদ্ধিমত্তা সম্পর্কিত অনেক সমস্যা ছিল যা সমাধান করা প্রয়োজন ছিল। ভিয়েতনামী জনগণের জীবনযাত্রার জন্য ভিয়েতনামী প্রযুক্তি সমাধান বিকাশের লক্ষ্য যৌথভাবে বাস্তবায়নের জন্য আমি অধ্যাপক ভু হা ভ্যানের আমন্ত্রণ গ্রহণ করেছি। আমি ভিয়েতনামে আমার প্রত্যাবর্তনকে অনেক বেশি অর্থবহ বলে মনে করি কারণ আমি আরও বেশি প্রভাবশালী সমস্যাগুলির উপর কাজ করতে সক্ষম হব।
একটি কর্মশালায় ডঃ দাও ডাক মিন
এনভিসিসি
কৃত্রিম বুদ্ধিমত্তা বিকাশের কৌশলে, বৃহৎ তথ্যের ভূমিকা এবং প্রভাব কী, স্যার? কৃত্রিম বুদ্ধিমত্তা প্রশিক্ষণে ডেটা অত্যন্ত গুরুত্বপূর্ণ এবং মূল্যবান ভূমিকা পালন করে। একটি উচ্চমানের কৃত্রিম বুদ্ধিমত্তা মডেলকে প্রশিক্ষণ দেওয়ার জন্য, আমরা প্রায়শই একটি বৃহৎ ডাটাবেস প্রশিক্ষণ দিয়ে শুরু করি। অতএব, মানসম্পন্ন কৃত্রিম বুদ্ধিমত্তা অর্জনের জন্য, আমাদের প্রথমে ভাল ডেটা থাকা প্রয়োজন। পরিমাণ এবং স্কেল, গুণমান, বৈচিত্র্য এবং সর্বজনীনতার দিক থেকে ভাল ডেটা মান পূরণ করতে হবে। কৃত্রিম বুদ্ধিমত্তা মডেলে ফিড করার জন্য সর্বোচ্চ মানের ডেটা তৈরি করার জন্য কাঁচা ডেটা পরিষ্কারের ধাপ থেকে হাজার হাজার ঘন্টা ডেটা সংগ্রহ এবং প্রক্রিয়াকরণের প্রক্রিয়াটি খুবই ব্যয়বহুল এবং জটিল। বিপরীতে, বৃহৎ তথ্য বিশ্লেষণ করার জন্য, আমাদের কৃত্রিম বুদ্ধিমত্তা ব্যবহার করতে হবে যাতে বৃহৎ স্কেলে ডেটা সঠিকভাবে প্রক্রিয়া করার ক্ষমতা নিশ্চিত করা যায়, যার ফলে আরও নির্ণায়ক বা ভবিষ্যদ্বাণীমূলক ফলাফল তৈরি হয়। উদাহরণস্বরূপ, ভিয়েতনামী জনগণের জন্য একটি ভার্চুয়াল সহকারী পণ্য (ViVi) তৈরির প্রক্রিয়ায়, আমাদের বিভিন্ন অঞ্চল, বিভিন্ন বয়স এবং লিঙ্গের লক্ষ লক্ষ কণ্ঠস্বর থেকে হাজার হাজার ঘন্টা উচ্চ-মানের অডিও ডেটা সংগ্রহ এবং প্রক্রিয়া করতে হয়েছিল, যার কন্টেন্ট শত শত ক্ষেত্রে বিস্তৃত ছিল... অথবা অতি সম্প্রতি, ViGPT - "শেষ ব্যবহারকারীদের জন্য ChatGPT-এর প্রথম ভিয়েতনামী সংস্করণ" চালু করা হয়েছে যা সম্পূর্ণরূপে VinBigdata-এর মালিকানাধীন একটি বিগ ল্যাঙ্গুয়েজ মডেল থেকে তৈরি করা হয়েছে। এই মডেলটি বিভিন্ন ক্ষেত্র থেকে 600 GB পরিমার্জিত ভিয়েতনামী ডেটার উপর ভিত্তি করে প্রশিক্ষিত করা হয়েছিল। ভিয়েতনামী ডেটা এবং ভাষা সম্পর্কে আমাদের বোধগম্যতার সাথে, আমরা ChatGPT-এর উৎক্ষেপণের সময়কে মাত্র 9 মাস কমিয়ে আনার জন্য একটি নতুন পদ্ধতি খুঁজে পেয়েছি। এটি বিগ ডেটা এবং কৃত্রিম বুদ্ধিমত্তার মধ্যে অনুরণন।
সমাজকে সেবা করার জন্য গবেষণাকে ব্যবহারিক মূল্যের সাথে সংযুক্ত করার বিষয়ে আপনার মতামত কী? - আমি বিশ্বাস করি যে প্রযুক্তি গবেষণা তখনই সত্যিকার অর্থে সফল হয় যখন এটি বাস্তবে জীবনে প্রবেশ করে, সামাজিক সমস্যা সমাধান করে এবং মানুষের জীবনকে উন্নত করে। ব্যবহারিক বাণিজ্যিক পণ্য তৈরি করতে এবং ব্যবসায়িক ও সামাজিক সমস্যা সমাধানের জন্য, আমাদের সর্বদা মনোযোগ দিতে হবে এবং প্রশ্ন জিজ্ঞাসা করতে হবে: ডেটা জীবনে কী মূল্য আনবে? এখন পর্যন্ত, আমরা বিভিন্ন শিল্প ও ক্ষেত্রে বিভিন্ন পণ্য এবং সমাধান নিয়ে গবেষণা করেছি, সাধারণত ViGPT, VinDr - মেডিকেল ইমেজিং ডায়াগনসিসে AI সমাধান প্রদানকারী, VinBase - কৃত্রিম বুদ্ধিমত্তার জন্য একটি প্ল্যাটফর্ম, অথবা Vizone - স্মার্ট ইমেজ বিশ্লেষণ সমাধানের একটি সেট।
ভিনগ্রুপ কর্পোরেশনের একটি অনুষ্ঠানে ভিনবিগডাটার গুরুত্বপূর্ণ কর্মীদের সাথে
এনভিসিসি
চতুর্থ শিল্প বিপ্লব বিশ্বব্যাপী দৃঢ়ভাবে সংঘটিত হচ্ছে। ভিয়েতনামের কী কী সুবিধা আছে বলে আপনার মনে হয়? পূর্ববর্তী বিপ্লবগুলির তুলনায়, আমার মনে হয় ভিয়েতনামের বর্তমানে এই ৪.০ শিল্প বিপ্লবে অনেক সুবিধা রয়েছে, যা বিশ্ব মানচিত্রে দেশের অবস্থান উন্নত করতে সাহায্য করবে। এই লক্ষ্য অর্জনের দুটি মূল চাবিকাঠি হল তথ্য এবং মানুষ। ভিয়েতনামে বর্তমানে প্রায় ১০ কোটি মানুষ রয়েছে, যার মধ্যে তরুণদের একটি বড় অংশ ফোন এবং ব্যক্তিগত কম্পিউটার ব্যবহার করে। এছাড়াও, আমাদের কৃত্রিম বুদ্ধিমত্তায় মর্যাদাপূর্ণ বিশেষজ্ঞ এবং তথ্য প্রযুক্তিতে তরুণ, উচ্চমানের কর্মী এবং গণিতে খুব ভালো ভিত্তি রয়েছে। তাহলে সীমাবদ্ধতাগুলি কী হবে? প্রথম যে সীমাবদ্ধতাটি দেখা যায় তা হল, বিশাল জনসংখ্যা থাকা সত্ত্বেও, আমাদের এখনও ডেটা আয়ত্ত করতে অসুবিধা হচ্ছে, বিশেষ করে সুবিধা, ব্যবসায়িক ইউনিট এবং প্রশাসনে ডেটা মানসম্মতকরণ এবং সিঙ্ক্রোনাইজেশন করতে। এছাড়াও, আমরা সীমিত বিনিয়োগ সম্পদ, বিশেষ করে উচ্চ-কার্যক্ষমতা সম্পন্ন কম্পিউটিং অবকাঠামোতে বিনিয়োগের মতো অন্যান্য সীমাবদ্ধতার মুখোমুখি হই।
আপনার মতে, ভিয়েতনামী জনগণের জীবনযাত্রার জন্য প্রযুক্তি তৈরি এবং আয়ত্ত করার যাত্রায় ভিয়েতনামী ডেটা আয়ত্ত করা কতটা গুরুত্বপূর্ণ? বর্তমানে, বিশ্বের অনেক শীর্ষস্থানীয় কৃত্রিম বুদ্ধিমত্তা পণ্য রয়েছে, সাধারণত AI অ্যাপ্লিকেশন পণ্যগুলি OpenAI দ্বারা ChatGPT বা Google দ্বারা Bard এর মতো বৃহৎ ভাষার মডেলের উপর ভিত্তি করে তৈরি করা হয়। তবে, ভিয়েতনামী এই পণ্যগুলির বিকাশের জন্য মূল ভাষা গোষ্ঠী নয়। অতএব, ব্যবহারকারীদের কাছে ফেরত দেওয়া ভিয়েতনামী-নির্দিষ্ট সামগ্রীর মান কমবেশি প্রভাবিত হয় এবং ত্রুটির উচ্চ সম্ভাবনা থাকে, আরও বিপজ্জনকভাবে, মৌলিক জ্ঞানে ত্রুটি। ভিয়েতনামী মানুষ হিসেবে, আমাদের নিজস্ব ডেটা উৎস অ্যাক্সেস করার সুবিধা রয়েছে। শুধুমাত্র আমাদের ভিয়েতনামী ডেটার বৈশিষ্ট্য, ভিয়েতনামী মানুষের চাহিদা এবং বৈশিষ্ট্যগুলি বোঝার ক্ষমতা আছে। অতএব, ভিয়েতনামী ডেটা আয়ত্ত করা সত্যিই মূল প্রযুক্তি আয়ত্ত করার মূল চাবিকাঠি, যা ভিয়েতনামী জনগণের সেবা করবে এমন প্রযুক্তিও।
ভিনবিগডাটা সদস্যদের জন্য অভ্যন্তরীণ প্রশিক্ষণ
এনভিসিসি
নির্দিষ্ট ডেটা উৎসগুলি কীভাবে অ্যাক্সেস করবেন, বিশেষ করে যখন বেশিরভাগ ভিয়েতনামী মানুষ আজ বিদেশ থেকে সোশ্যাল নেটওয়ার্কিং সাইট ব্যবহার করে? প্রকৃতপক্ষে, আজকের মানব তথ্যের সবচেয়ে বড় উৎস (শুধু ভিয়েতনামী মানুষ নয়) হল ইন্টারনেট এবং সোশ্যাল নেটওয়ার্ক। যাইহোক, আমরা এখনও বিভিন্ন উৎস থেকে ডেটা অ্যাক্সেস এবং সংগ্রহ করতে পারি, প্রতিটি প্রকল্প দ্বারা নির্ধারিত বৈশিষ্ট্যের উপর নির্ভর করে ভিয়েতনামী ডেটার বৈশিষ্ট্যগুলি বোঝার উপর ভিত্তি করে। উদাহরণস্বরূপ, OpenAI-এর GPT মডেলগুলিতে শত শত, এমনকি ট্রিলিয়ন প্যারামিটার রয়েছে, যা বিপুল পরিমাণে ডেটার উপর প্রশিক্ষিত এবং বিলিয়ন ডলার খরচ করে। তাদের তুলনায়, আমরা আমাদের গবেষণা, ক্ষমতা এবং সম্পদের উপর ভিত্তি করে সম্পূর্ণ ভিন্ন দিক বেছে নিয়েছি: অর্থাৎ, মাত্র কয়েক বিলিয়ন প্যারামিটারের একটি আর্কিটেকচার সহ একটি ভিয়েতনামী ভাষা মডেল তৈরি করা, 600 GB ভিয়েতনামী ডেটার সেটের উপর প্রশিক্ষিত যা আমরা নিজেদের সংগ্রহ এবং পরিমার্জিত করেছি, কিন্তু ভিয়েতনামী প্রক্রিয়া করার একই ক্ষমতা রয়েছে। ফলাফলগুলি দেখায় যে আমাদের স্ব-উন্নত স্থাপত্য স্ব-অপ্টিমাইজ করতে পারে, ভাষা মডেল প্রশিক্ষণের সময় কমাতে পারে, খরচ কমাতে পারে এবং মডেলের গুণমান নিশ্চিত করতে পারে। কৃত্রিম বুদ্ধিমত্তা পণ্য গবেষণা এবং বিকাশের প্রক্রিয়ায় আপনি এবং আপনার দল কোন চ্যালেঞ্জগুলির মুখোমুখি হয়েছেন? প্রথম চ্যালেঞ্জ অবশ্যই সময়। কৃত্রিম বুদ্ধিমত্তা প্রযুক্তির ঢেউ খুব দ্রুত আসছে এবং বিস্ফোরণের সময়সীমা অতিক্রম করছে। বিশ্বের শীর্ষস্থানীয় প্রযুক্তি কোম্পানিগুলি দ্রুত অত্যন্ত সম্পূর্ণ পণ্য বাজারে এনেছে যা ক্রমাগত আপডেট এবং উন্নত হচ্ছে। যদি আমরা ধীরগতিতে থাকি এবং সময়মতো পণ্য বাজারে না আনি, তাহলে আমরা অবশ্যই পিছিয়ে পড়ব। অন্যদিকে, আমরা যদি এমন পণ্য তৈরি করতে চাই যা প্রয়োগযোগ্য এবং ব্যবহারিক সামাজিক সমস্যা সমাধান করতে পারি, তাহলে আমাদের পণ্যের অসামান্য, বিশেষ এবং অনন্য বৈশিষ্ট্যগুলি খুঁজে বের করা এবং বিকাশের কথাও বিবেচনা করতে হবে।
প্রকৃতপক্ষে, ভিয়েতনাম এবং বিশ্বজুড়ে অনেক ব্যক্তি এবং প্রতিষ্ঠান ডেটা ফাঁসের ঘটনায় ব্যাপক ক্ষতির সম্মুখীন হয়েছে। ডেটা সুরক্ষার বিষয়টি আপনি কীভাবে দেখেন? বলা যেতে পারে যে আজকের যেকোনো অ্যাপ্লিকেশন ডেটা থেকে আসে। ডেটা নিয়ে কাজ করার সময়, একদিকে আমাদের জীবনের জন্য সর্বোত্তম প্রযুক্তি তৈরির জন্য ডেটা প্রয়োগের লক্ষ্য নিশ্চিত করতে হবে, এবং অন্যদিকে, ব্যক্তি এবং সংস্থার জন্য ডেটা সুরক্ষা নিশ্চিত করতে হবে। ডেটা সুরক্ষা নিশ্চিত করার প্রক্রিয়ায় মানবিক উপাদান একটি অত্যন্ত গুরুত্বপূর্ণ লিঙ্ক। এর মধ্যে রয়েছে ডেভেলপার, পণ্য ব্যবহারকারী এবং ব্যবহারকারী। ডেভেলপারদের জন্য, ডেটা সংগ্রহ এবং প্রক্রিয়াকরণের শুরু থেকেই ডেটা সুরক্ষা সম্পর্কে সচেতনতা থাকা উচিত। প্রায়শই, যখন কোনও সমস্যা দেখা দেয় না, তখন আমরা ডেটা সুরক্ষার গুরুত্ব সম্পর্কে সচেতন থাকি না। কিন্তু যদি ডেটা ফাঁস হয়, তাহলে ক্ষতি বিশাল হতে পারে। প্রযুক্তিগত সমস্যা বা ইচ্ছাকৃত ডেটা চুরির আক্রমণের কারণে ডেটা লঙ্ঘন ঘটতে পারে। যখন ডেটা লঙ্ঘন করা হয়, তখন ব্যক্তি বা সংস্থাগুলি খারাপ লোকদের দ্বারা অবৈধ উদ্দেশ্যে তাদের তথ্য ব্যবহার করতে পারে, অন্যদিকে ব্যবসাগুলি সম্পর্কিত সমস্যাগুলি সমাধান করতে আর্থিক ক্ষতির সম্মুখীন হতে পারে, এমনকি তাদের ব্র্যান্ডেরও ক্ষতি করতে পারে।
একটি অনুষ্ঠানে ডঃ দাও ডুক মিন এবং ভিনবিগডাটা টিম
এনভিসিসি
ভিয়েতনামের জনগণের সেবা করার জন্য প্রযুক্তিতে দক্ষতা অর্জনের আকাঙ্ক্ষার পর, বিশ্বে এগিয়ে যাওয়ার জন্য অবশ্যই পদক্ষেপ নিতে হবে? যে কোনও সংস্থা বা উদ্যোগ যারা তাদের পণ্য আন্তর্জাতিক বাজারে আনতে চায় তাদের অবশ্যই আন্তর্জাতিক মান মেনে চলতে হবে। ভিনবিগডাটার সমাধান এবং প্রযুক্তিতে শক্তি রয়েছে, তাই বিশ্ব জয় করার জন্য একটি দৃষ্টিভঙ্গি স্থাপন করা স্বাভাবিক। অবশ্যই, বিভিন্ন পণ্য এবং অ্যাপ্লিকেশনের জন্য মোতায়েনের জন্য, বহু বছরের অভিজ্ঞতা এবং বিশ্বজুড়ে ব্যবহারকারীদের বোঝাপড়া সহ আন্তর্জাতিক ইউনিটগুলির সাহচর্য থাকা প্রয়োজন। ধন্যবাদ!
মন্তব্য (0)