នៅក្នុង ពិភព ឌីជីថល អ្នកប្រើប្រាស់ត្រូវការឧបករណ៍ដើម្បីជួយផ្ទៀងផ្ទាត់ព័ត៌មាន។
នៅក្នុងយុគសម័យឌីជីថល ប្រព័ន្ធផ្សព្វផ្សាយសង្គម និងប្រព័ន្ធអនឡាញបានក្លាយទៅជាបណ្តាញព័ត៌មានដ៏សំខាន់សម្រាប់មនុស្សរាប់សិបលាននាក់ជារៀងរាល់ថ្ងៃ។ ទោះជាយ៉ាងណាក៏ដោយ រួមជាមួយនឹងភាពងាយស្រួល ព័ត៌មានក្លែងក្លាយ និងព័ត៌មានមិនពិតដែលរីករាលដាលក្នុងល្បឿនវិលមុខ គឺជាការពិតគួរឱ្យព្រួយបារម្ភ។ នៅក្នុងបរិបទនេះ តម្រូវការដើម្បីផ្ទៀងផ្ទាត់ព័ត៌មានតាមរយៈការប្រៀបធៀប និងការផ្ទៀងផ្ទាត់ភាពត្រឹមត្រូវនៃអ្វីដែលយើងអាន ឮ និងចែករំលែកក្លាយជាចាំបាច់។
ប្រឈមមុខនឹងស្ថានភាពនេះ មជ្ឈមណ្ឌលសេវាកម្មទិន្នន័យ និងបញ្ញាសិប្បនិមិត្ត របស់ Viettel បានស្រាវជ្រាវ និងបង្កើត ClaimPKG ដែលជាវិធីសាស្ត្រផ្ទៀងផ្ទាត់ព័ត៌មានដ៏មានប្រសិទ្ធភាព ជាមួយនឹងសមត្ថភាពក្នុងការអនុវត្តជាក់ស្តែង។ ការស្រាវជ្រាវនេះបានលើសពីការសិក្សាជាង 5,200 នៅទូទាំងពិភពលោកដែលត្រូវបានណែនាំដោយផ្ទាល់នៅ ACL 2025។ នេះគឺជាសន្និសីទឈានមុខគេមួយរបស់ពិភពលោកស្តីពីដំណើរការភាសាធម្មជាតិ (NLP) ជាមួយនឹងអត្រាទទួលយកបទបង្ហាញត្រឹមតែ 37% ប៉ុណ្ណោះ។ ព្រឹត្តិការណ៍នេះប្រមូលផ្តុំអ្នកជំនាញបច្ចេកវិទ្យាឈានមុខគេពីក្រុមហ៊ុនយក្សដូចជា Google, Meta, Huawei, IBM, Amazon, Oracle ជាដើម។
ClaimPKG រួមបញ្ចូលគ្នានូវក្រាហ្វចំណេះដឹង និងគំរូភាសាធំមួយ (LLM) ដោយធ្វើអោយប្រសើរឡើងនូវភាពត្រឹមត្រូវពី 9% ទៅ 12% បើប្រៀបធៀបទៅនឹងវិធីសាស្រ្តបច្ចុប្បន្ននៅពេលសាកល្បងលើ FactKG (សំណុំទិន្នន័យគោលដែលត្រូវបានចាត់ទុកយ៉ាងខ្លាំងដោយសហគមន៍បច្ចេកវិទ្យាក្នុងការត្រួតពិនិត្យការពិត)។ លទ្ធផលតេស្តនេះបង្ហាញពីសក្ដានុពលខ្លាំងរបស់ ClaimPKG ដើម្បីបង្កើនភាពជឿជាក់នៃប្រព័ន្ធពិនិត្យការពិត AI នាពេលអនាគត។
កាលពីមុន នៅក្នុងសន្និសិទ NAACL 2025 មជ្ឈមណ្ឌលសេវាកម្ម Viettel Data and Artificial Intelligence Service Center ក៏បានទាក់ទាញការយកចិត្តទុកដាក់ជាមួយ VeGraph ដែលជាវិធីសាស្ត្រផ្ទៀងផ្ទាត់ព័ត៌មានផ្អែកលើវេទិកាចំណេះដឹងអត្ថបទដូចជា អត្ថបទ ឯកសារច្បាប់ជាដើម។ VeGraph បានកត់ត្រាការធ្វើឱ្យប្រសើរឡើងពី 2-5% ក្នុងភាពត្រឹមត្រូវបើធៀបនឹងវិធីសាស្រ្តផ្សេងទៀត ប៉ុន្តែក្នុងករណីជាច្រើន កង្វះខាតពេលវេលាច្បាស់លាស់ រចនាសម្ព័ន្ធ និងទិន្នន័យ។ ធានាឱ្យមានភាពស៊ីសង្វាក់គ្នា។
ដើម្បីកែលម្អភាពត្រឹមត្រូវនិងភាពស៊ីសង្វាក់គ្នា មជ្ឈមណ្ឌលសេវាកម្មទិន្នន័យ និងបញ្ញាសិប្បនិម្មិត Viettel បន្តស្វែងរកទិសដៅមួយផ្សេងទៀត។ ClaimPKG ត្រូវបានបង្កើតឡើងដោយវិធីសាស្រ្តផ្អែកលើចំណេះដឹងដែលមានរចនាសម្ព័ន្ធ ដោយប្រើក្រាហ្វចំណេះដឹងដែលបានធ្វើទ្រង់ទ្រាយយ៉ាងច្បាស់យោងទៅតាមគំរូ "ប្រធានបទ-ទំនាក់ទំនង-វត្ថុ"។
ព័ត៌មានដែលត្រូវផ្ទៀងផ្ទាត់នឹងត្រូវបានបំបែក និងបំប្លែងទៅជា "pseudo-subgraph" បន្ទាប់មកប្រព័ន្ធនឹងទាញយកចំណេះដឹងដែលពាក់ព័ន្ធនៅក្នុងក្រាហ្វចំណេះដឹង ហើយបន្ទាប់មកអនុញ្ញាតឱ្យ LLM ធ្វើការសន្និដ្ឋាន និងទាញការសន្និដ្ឋានចុងក្រោយ។ ដំណើរការនេះជួយបង្កើនភាពត្រឹមត្រូវ ភាពស៊ីសង្វាក់ និងភាពជឿជាក់នៃការផ្ទៀងផ្ទាត់ ខណៈពេលដែលកាត់បន្ថយបន្ទុកកុំព្យូទ័រលើ LLM ។
គុណសម្បត្តិបច្ចេកទេសរបស់ ClaimPKG ក៏ជាមូលដ្ឋានគ្រឹះសម្រាប់ពង្រីកការអនុវត្តជាក់ស្តែងផងដែរ។ នៅក្នុងវិស័យសារព័ត៌មាន និងប្រព័ន្ធផ្សព្វផ្សាយ បច្ចេកវិទ្យាអាចគាំទ្រអ្នកយកព័ត៌មាន និងអ្នកកែសម្រួលដើម្បីស្វែងរកព័ត៌មានក្លែងក្លាយ និងប្រៀបធៀបប្រភពយ៉ាងឆាប់រហ័ស និងជាមូលដ្ឋាន។
នៅក្នុងផ្នែក វេជ្ជសាស្ត្រ និងផ្នែកច្បាប់ បច្ចេកវិទ្យានេះអាចដើរតួជា "ជំនួយការផ្ទៀងផ្ទាត់" ដោយជួយស្វែងរក និងផ្ទៀងផ្ទាត់ចំណេះដឹងឯកទេស។ លើសពីនេះ ClaimPKG ក៏មានសក្ដានុពលក្នុងការបញ្ចូលទៅក្នុង chatbots ឬជំនួយការនិម្មិត ជួយឱ្យប្រព័ន្ធផ្តល់ចម្លើយដែលអាចទុកចិត្តបានបន្ថែមទៀត ជៀសវាងការវិនិច្ឆ័យមិនច្បាស់លាស់។
ACL 2025 (កិច្ចប្រជុំប្រចាំឆ្នាំរបស់សមាគមសម្រាប់ភាសាវិទ្យាគណនា) ដែលប្រព្រឹត្តទៅចាប់ពីថ្ងៃទី 27 ខែកក្កដា ដល់ថ្ងៃទី 1 ខែសីហា នៅទីក្រុងវីយែន ប្រទេសអូទ្រីស គឺជាព្រឹត្តិការណ៍ដ៏មានកិត្យានុភាព និងមានឥទ្ធិពលបំផុតមួយរបស់ពិភពលោកនៅក្នុងវិស័យ NLP ។ ដោយមានអ្នកស្រាវជ្រាវ វិស្វករ និងអ្នកជំនាញអន្តរជាតិរាប់ពាន់នាក់ សន្និសីទនេះគឺជាកន្លែងចែករំលែកភាពជឿនលឿនចុងក្រោយបង្អស់នៅក្នុង NLP ពីការរៀនភាសា ម៉ាស៊ីន ការបកប្រែម៉ាស៊ីន ការសង្ខេបអត្ថបទ ការឆ្លើយសំណួរដោយស្វ័យប្រវត្តិចំពោះបញ្ហាក្រមសីលធម៌ និងយុត្តិធម៌នៅក្នុងភាសា AI ។
នៅឆ្នាំនេះ ប្រធានបទសំខាន់នៃសន្និសីទគឺ "ការធ្វើឱ្យទូទៅនៃគំរូ NLP" ដោយសង្កត់ធ្ងន់លើការអភិវឌ្ឍន៍គំរូដែលអាចសម្របខ្លួន និងយល់អំពីទិន្នន័យ ភាសា ឬដែនថ្មីៗ។
ហាលីញ
ប្រភព៖ https://nhandan.vn/cong-nghe-tri-tue-nhan-tao-giup-kiem-chung-thong-tin-post898494.html
Kommentar (0)