Vietnam.vn - Nền tảng quảng bá Việt Nam

CMC ជាប់ចំណាត់ថ្នាក់ទី 12 នៅលើពិភពលោកក្នុងការទទួលស្គាល់អត្ថបទ

គំរូ CATI-VLM (Visual Document Understanding) ដែលបង្កើតឡើងដោយ CMC Technology Application Institute (CMC ATI) បានវ៉ាដាច់ដៃគូប្រកួតប្រជែងអន្តរជាតិជាច្រើន ដើម្បីឈានដល់ចំណាត់ថ្នាក់កំពូលទាំង 12 នៅលើពិភពលោក និងកំពូលលេខ 1 នៅវៀតណាមក្នុងចំណាត់ថ្នាក់ដែលទើបប្រកាសដោយការប្រកួតប្រជែងការអានដ៏រឹងមាំ (RRC) ក្នុងខែមិថុនា ឆ្នាំ 2025 ក្នុងប្រភេទ Document Visual Question Answering (DocVQA)។

Báo Nhân dânBáo Nhân dân02/07/2025

ចំណាត់ថ្នាក់ RRC នៅក្នុងប្រភេទ DocVQA 6/2025 ។

ចំណាត់ថ្នាក់ RRC នៅក្នុងប្រភេទ DocVQA 6/2025 ។

ក្នុងបរិបទនៃការបំប្លែងឌីជីថល និងការបំប្លែងកម្មវិធីបញ្ញាសិប្បនិមិត្តក្នុងប្រទេសវៀតណាមដែលកំពុងប្រព្រឹត្តទៅយ៉ាងខ្លាំងក្លា បច្ចេកវិទ្យា OCR (ការទទួលស្គាល់តួអក្សរអុបទិក) ដើរតួនាទីយ៉ាងសំខាន់កាន់តែខ្លាំងឡើងក្នុងការរៀបចំឯកសារឌីជីថល ស្វ័យប្រវត្តិកម្មដំណើរការអាជីវកម្ម សន្សំការចំណាយ និងបង្កើនប្រសិទ្ធភាពការគ្រប់គ្រង។ ទោះបីជាយ៉ាងណាក៏ដោយ ជាមួយនឹងលក្ខណៈរបស់ជនជាតិវៀតណាមដែលមានការបញ្ចេញសំឡេង និងការសរសេរដោយដៃ បញ្ហាការទទួលស្គាល់មិនឈប់ត្រឹម 'ការអានពាក្យ' នោះទេ ប៉ុន្តែទាមទារឱ្យគំរូមានសមត្ថភាពក្នុងការយល់អំពីបរិបទឱ្យបានទូលំទូលាយ។

ថ្មីៗនេះ វិទ្យាស្ថានកម្មវិធីបច្ចេកវិទ្យា CMC (CMC ATI) បានប្រកាសអំពីគំរូ CATI-VLM (Visual Document Understanding) ដែលបង្កើតឡើងដោយក្រុមស្រាវជ្រាវពីឃ្លាំងទិន្នន័យធំ 5TB ដោយវ៉ាដាច់ដៃគូប្រកួតប្រជែងអន្តរជាតិជាច្រើនដើម្បីឈានដល់ចំណាត់ថ្នាក់កំពូលទាំង 12 នៅលើពិភពលោក និងលេខ 1 នៅប្រទេសវៀតណាមក្នុងចំណាត់ថ្នាក់ដែលទើបតែប្រកាសដោយការប្រកួតប្រជែងអានដ៏រឹងមាំ (RRC) ក្នុងខែមិថុនា ឆ្នាំ 2025 (Quocusa) ប្រភេទ។

ការប្រកួតប្រជែងការអានដ៏រឹងមាំ (RRC) គឺជាកន្លែងលេង បែបវិទ្យាសាស្ត្រ ដ៏មានកិត្យានុភាព (https://rrc.cvc.uab.es/) ដែលរៀបចំដោយមជ្ឈមណ្ឌលចក្ខុវិស័យកុំព្យូទ័រ (CVC) នៃសាកលវិទ្យាល័យអូតូណូម៉ាដឺបាសេឡូណា (UAB) អេស្បាញ ដែលជាកន្លែងស្រាវជ្រាវដ៏មានកិត្យានុភាពនៅលើពិភពលោកក្នុងវិស័យចក្ខុវិស័យកុំព្យូទ័រ។

ការប្រកួតប្រជែងនេះត្រូវបានផ្តួចផ្តើមនៅក្នុងឆ្នាំ 2011 ហើយត្រូវបានប្រារព្ធឡើងជារៀងរាល់ឆ្នាំក្នុងក្របខ័ណ្ឌនៃសន្និសីទអន្តរជាតិស្តីពីការវិភាគ និងការទទួលស្គាល់អត្ថបទ (ICDAR) ដែលជាវេទិកាឈានមុខគេមួយ របស់ពិភពលោក ក្នុងវិស័យចក្ខុវិស័យកុំព្យូទ័រ។ ការប្រកួតប្រជែងទាក់ទាញអ្នកស្រាវជ្រាវ និងវិស្វករមួយចំនួនធំមកពីសាកលវិទ្យាល័យ វិទ្យាស្ថានស្រាវជ្រាវ និងសាជីវកម្មបច្ចេកវិទ្យាធំៗដូចជា Tsinghua University, Hyundai Motor Group, Tencent... បញ្ហារបស់ RRC ត្រូវបានរចនាឡើងដើម្បីលើកកម្ពស់វឌ្ឍនភាពបច្ចេកវិទ្យា ភ្ជាប់យ៉ាងជិតស្និទ្ធទៅនឹងបញ្ហាជាក់ស្តែងពីការបកប្រែ ការគ្រប់គ្រងទិន្នន័យសហគ្រាស រហូតដល់ការវិភាគទីក្រុង និងដំណើរការឯកសារប្រវត្តិសាស្ត្រ។

លោកបណ្ឌិត Dang Minh Tuan នាយក CMC ATI បានចែករំលែកថា៖ “យើងមានសេចក្តីសោមនស្សរីករាយដែលសមត្ថភាពស្រាវជ្រាវរបស់ក្រុម CMC ត្រូវបានបញ្ជាក់តាមរយៈសួនកុមារពិភពលោកដ៏មានកិត្យានុភាពដូចជា RRC ។ ក្នុងរយៈពេលដ៏ខ្លី ក្រុមស្រាវជ្រាវទទួលបានចំណាត់ថ្នាក់ខ្ពស់ បង្ហាញពីការប្រកួតប្រជែងអន្តរជាតិជាមួយនឹងឈ្មោះធំៗមកពីប្រទេសអភិវឌ្ឍន៍។ វៀតណាម»។

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg

លោកបណ្ឌិត Dang Minh Tuan នាយក CMC ATI ។

CATI-VLM ខុសពី OCR ប្រពៃណី ដោយវាមិនត្រឹមតែស្រង់តួអក្សរប៉ុណ្ណោះទេ ប៉ុន្តែវាក៏យល់អំពីស្រទាប់ជាច្រើននៃព័ត៌មានផងដែរ៖ ខ្លឹមសារអត្ថបទ ធាតុដែលមិនមែនជាអត្ថបទ (ប្រអប់ធីក ប្រអប់ធីក គំនូសតាង ហត្ថលេខា រូបមន្ត) ប្លង់ (រចនាសម្ព័ន្ធទំព័រ តារាង ទម្រង់) និងរចនាប័ទ្ម (ពុម្ពអក្សរ គំនួសពណ៌។ល។)។ គំរូអាចឆ្លើយសំណួរដែលមើលឃើញនៅលើរូបភាពឯកសារស្រដៀងនឹង ChatGPT ដោយមិនចាំបាច់សិក្សាទម្រង់ជាក់លាក់ជាមុន។

គួរកត់សម្គាល់ថានៅលើចំណាត់ថ្នាក់ RRC CATI-VLM ដែលមានប៉ារ៉ាម៉ែត្រត្រឹមតែ 3 ពាន់លានទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុតនៅក្នុងសំណុំទិន្នន័យ 4/7 លើសពីម៉ូដែល Big Tech ជាច្រើនដូចជា Deepseek (27 ពាន់លានប៉ារ៉ាម៉ែត្រ), GPT-4 Vision Turbo + Amazon Textract OCR (កំពូល 34) ឬ Baidu (កំពូល 22) ។

សមិទ្ធិផលនេះក៏បង្ហាញពីវិធីសាស្រ្តជាក់ស្តែង ដោយផ្តោតលើការធ្វើជាម្ចាស់នៃបច្ចេកវិទ្យាស្នូល បង្កើនប្រសិទ្ធភាពគំរូឱ្យសមស្របនឹងលក្ខខណ្ឌហេដ្ឋារចនាសម្ព័ន្ធរបស់វៀតណាម ជំនួសឱ្យការដេញតាមមាត្រដ្ឋានប៉ារ៉ាម៉ែត្រ។

រូបភាព-2.jpg

ទម្រង់ពាក្យសុំចូលរៀនមហាវិទ្យាល័យគំរូ

រូបភាព-3.jpg

អត្ថបទត្រូវបានទទួលស្គាល់ពីការសរសេរដោយដៃក្នុងរូបភាពខាងលើ។

លោក Nguyen Trung Chinh ប្រធានក្រុមប្រឹក្សាភិបាល ប្រធានប្រតិបត្តិនៃ CMC Technology Group បានសង្កត់ធ្ងន់ថា៖ “នេះគឺជាលទ្ធផលនៃជាងមួយទសវត្សរ៍នៃការវិនិយោគឥតឈប់ឈរក្នុងការស្រាវជ្រាវ និងអភិវឌ្ឍន៍បច្ចេកវិទ្យា (R&D)។ សមិទ្ធិផលខ្ពស់របស់ CMC ក្នុងសួនកុមារបច្ចេកវិទ្យាអន្តរជាតិបានអះអាងនូវយុទ្ធសាស្ត្រធ្វើជាម្ចាស់នៃបច្ចេកវិទ្យាវៀតណាម រួមជាមួយនឹងការតំរង់ទិសនៃ AI Transformation បញ្ញា និងឈានចូលទីផ្សារបច្ចេកវិទ្យារបស់វៀតណាមយ៉ាងពេញទំហឹង។ ការបង្កើតទីតាំងដ៏សក្តិសមនៅលើផែនទីបច្ចេកវិជ្ជាពិភពលោក»។

CATI-VLM នឹងត្រូវបានអនុវត្តនៅក្នុងខ្សែសង្វាក់ផលិតផលនៃប្រព័ន្ធអេកូ C.OpenAI រួមមានៈ ជំនួយការនិម្មិត CLS សម្រាប់ពិនិត្យមើលឯកសារច្បាប់ CMC SmartDoc - វេទិកាបម្លែងឯកសារឌីជីថល ប្រព័ន្ធគ្រប់គ្រងចំណេះដឹង CMC KMS ប្រព័ន្ធរាយការណ៍ដោយស្វ័យប្រវត្តិសម្រាប់ការិយាល័យឆ្លាតវៃ និងកម្មវិធីឯកសារ Agentic ជំនាន់ថ្មី។

ក្វាង ហ៊ុយ

ប្រភព៖ https://nhandan.vn/cmc-dat-top-12-the-gioi-ve-nhan-dang-van-ban-post891252.html


Etikett: CMCCMC Corp

Kommentar (0)

No data
No data

ប្រធានបទដូចគ្នា

ប្រភេទដូចគ្នា

ភាពស្រស់ស្អាតនៃឈូងសមុទ្រ Ha Long ត្រូវបាន UNESCO ទទួលស្គាល់ជាបេតិកភណ្ឌបីដង។
បាត់​ខ្លួន​ក្នុង​ការ​បរបាញ់​ពពក​នៅ Ta Xua
មាន​ភ្នំ​ផ្កា​ស៊ីម​ពណ៌​ស្វាយ​នៅ​លើ​មេឃ​នៃ​ Son La
ចង្កៀងគោម - អំណោយពិធីបុណ្យពាក់កណ្តាលរដូវស្លឹកឈើជ្រុះនៅក្នុងការចងចាំ

អ្នកនិពន្ធដូចគ្នា

បេតិកភណ្ឌ

;

រូប

;

អាជីវកម្ម

;

No videos available

ព្រឹត្តិការណ៍បច្ចុប្បន្ន

;

ប្រព័ន្ធនយោបាយ

;

ក្នុងស្រុក

;

ផលិតផល

;