គំរូបញ្ញាសិប្បនិមិត្ត R1 របស់ក្រុមហ៊ុន DeepSeek របស់ចិន ដែលធ្វើអោយទីផ្សារភាគហ៊ុនអាមេរិកភ្ញាក់ផ្អើលនៅពេលវាចាប់ផ្តើមក្នុងខែមករា ត្រូវបានគេបោះពុម្ពផ្សាយនៅក្នុងការសិក្សាដែលបានពិនិត្យដោយមិត្តភ័ក្តិលើកដំបូង ដោយបង្ហាញពីរបៀបដែលវាបង្កើត LLM ដ៏មានអានុភាពក្នុងតម្លៃត្រឹមតែ $300,000 ។
R1 ត្រូវបានរចនាឡើងដើម្បីពូកែក្នុងការងារវែកញែកដូចជាគណិតវិទ្យា និងការសរសេរកម្មវិធី ដែលធ្វើឱ្យវាជាគូប្រជែងតម្លៃទាបចំពោះឧបករណ៍ដែលបង្កើតឡើងដោយក្រុមហ៊ុនបច្ចេកវិទ្យាយក្សរបស់អាមេរិក។
នេះគឺជាគំរូ "ទម្ងន់បើកចំហ" ដែលអាចទាញយកដោយឥតគិតថ្លៃ ហើយបច្ចុប្បន្នជាម៉ូដែលពេញនិយមបំផុតនៅលើវេទិកា Hugging Face ជាមួយនឹងការទាញយកជាង 10.9 លានដង។
ការសិក្សាធម្មជាតិ ដែលជាការធ្វើបច្ចុប្បន្នភាពនៃសាត្រាស្លឹករឹតខែមករា បានបង្ហាញជាលើកដំបូងថា ការបណ្តុះបណ្តាល R1 ចំណាយត្រឹមតែ 294,000 ដុល្លារ បន្ថែមពីលើការចំណាយប្រហែល 6 លានដុល្លារសម្រាប់ការសាងសង់គំរូមូលដ្ឋាន។
តួលេខនេះគឺទាបជាងប្រាក់រាប់សិបលានដុល្លារដែលគូប្រជែងត្រូវបានគេនិយាយថាបានចំណាយទៅទៀត។
DeepSeek បាននិយាយថា R1 ត្រូវបានបណ្តុះបណ្តាលជាចម្បងដោយប្រើបន្ទះឈីប Nvidia H800 ដែលសហរដ្ឋអាមេរិកបានហាមឃាត់មិនឱ្យនាំចេញទៅកាន់ប្រទេសចិនចាប់តាំងពីឆ្នាំ 2023 ។
របកគំហើញរបស់ R1 គឺការប្រើប្រាស់របស់វានៃ "ការរៀនពង្រឹងសុទ្ធ" ដែលគំរូត្រូវបានបណ្តុះបណ្តាលលើការសាកល្បង និងកំហុស ហើយផ្តល់រង្វាន់សម្រាប់ចម្លើយត្រឹមត្រូវ ជាជាងការរៀនពីឧទាហរណ៍ដែលបានជ្រើសរើសដោយមនុស្ស។ វាក៏ដាក់ពិន្ទុលើកិច្ចខិតខំប្រឹងប្រែងរបស់ខ្លួនផងដែរ ដោយប្រើការប៉ាន់ប្រមាណផ្ទៃក្នុង ដែលជាបច្ចេកទេសមួយហៅថា "ការបង្កើនប្រសិទ្ធភាពគោលនយោបាយក្រុមដែលទាក់ទង" ដែលជួយជំរុញការអនុវត្ត។
អ្នកស្រាវជ្រាវ Huan Sun (សាកលវិទ្យាល័យ Ohio State University) មានប្រសាសន៍ថា "ដំណើរការត្រួតពិនិត្យពីមិត្តភ័ក្តិយ៉ាងម៉ត់ចត់ជួយឱ្យតម្លៃ និងភាពជឿជាក់របស់ម៉ូដែលមានសុពលភាព"។ "ក្រុមហ៊ុនផ្សេងទៀតគួរតែធ្វើដូចគ្នា" ។
លោក Lewis Tunstall វិស្វករសិក្សាម៉ាស៊ីននៅ Hugging Face បាននិយាយថា នេះគឺជាគំរូដ៏សំខាន់មួយ ពីព្រោះតម្លាភាពក្នុងការអភិវឌ្ឍន៍ AI ជួយឱ្យវាយតម្លៃហានិភ័យកាន់តែត្រឹមត្រូវ។
DeepSeek អះអាងថា R1 មិនត្រូវបានបណ្តុះបណ្តាលដោយប្រើទិន្នន័យពីគំរូរបស់ OpenAI ទោះបីជាវាទទួលស្គាល់ថាគំរូមូលដ្ឋានត្រូវបានបណ្តុះបណ្តាលលើទិន្នន័យគេហទំព័រ — ដែលអាចរួមបញ្ចូលមាតិកាដែលបង្កើតដោយ AI ។
អ្នកជំនាញនិយាយថា ខណៈពេលដែលវាពិបាកក្នុងការផ្ទៀងផ្ទាត់ពិតប្រាកដ ភស្តុតាងបច្ចុប្បន្នបង្ហាញថាការពង្រឹងសុទ្ធគឺគ្រប់គ្រាន់ដើម្បីសម្រេចបាននូវការអនុវត្តខ្ពស់។
នៅលើការធ្វើតេស្ត ScienceAgentBench R1 មិនបានឈរនៅលើតារាងភាពត្រឹមត្រូវនោះទេ ប៉ុន្តែវាបានធ្វើឱ្យមានតុល្យភាពដ៏ល្អរវាងប្រសិទ្ធភាព និងការចំណាយ។ ឥឡូវនេះអ្នកស្រាវជ្រាវកំពុងសម្លឹងមើលដើម្បីអនុវត្តវិធីសាស្រ្តរបស់ DeepSeek ដើម្បីបង្កើនសមត្ថភាពហេតុផលនៃ LLMs ដែលមានស្រាប់ ក៏ដូចជាពង្រីកវាទៅផ្នែកលើសពីគណិតវិទ្យា និងកម្មវិធី។
យោងតាមលោក Tunstall R1 បាន "ចាប់ផ្តើមបដិវត្តន៍" នៅក្នុងការអភិវឌ្ឍន៍បញ្ញាសិប្បនិម្មិត។/.
ប្រភព៖ https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp
Kommentar (0)