អ្នកស្រាវជ្រាវនៅ DeepSeek បានប្រកាសអំពីគំរូពិសោធន៍ថ្មីមួយហៅថា V3.2-exp ដែលត្រូវបានរចនាឡើងដើម្បីកាត់បន្ថយការចំណាយនៃការសន្និដ្ឋានយ៉ាងសំខាន់នៅពេលប្រើក្នុងប្រតិបត្តិការបរិបទវែង។
DeepSeek បានប្រកាសអំពីម៉ូដែលនេះនៅក្នុងការបង្ហោះនៅលើ Hugging Face ហើយក៏បានបង្ហោះក្រដាសសិក្សាដែលភ្ជាប់នៅលើ GitHub ផងដែរ។
លក្ខណៈពិសេសសំខាន់បំផុតនៃគំរូថ្មីដ៏ស្មុគស្មាញត្រូវបានគេហៅថា DeepSeek Sparse Attention។ ជាការសំខាន់ ប្រព័ន្ធប្រើប្រាស់ម៉ូឌុលមួយហៅថា "កម្មវិធីសន្ទស្សន៍រន្ទះ" ដើម្បីផ្តល់អាទិភាពដល់ការដកស្រង់ជាក់លាក់ពីបង្អួចបរិបទ។

ប្រព័ន្ធដាច់ដោយឡែកមួយហៅថា "ប្រព័ន្ធជ្រើសរើសសញ្ញាសម្ងាត់ល្អិតល្អន់" បន្ទាប់មកជ្រើសរើសសញ្ញាសម្ងាត់ជាក់លាក់ពីផ្នែកតូចៗទាំងនោះដើម្បីផ្ទុកទៅក្នុងបង្អួចយកចិត្តទុកដាក់មានកំណត់របស់ម៉ូឌុល។ រួមបញ្ចូលគ្នា ពួកគេអនុញ្ញាតឱ្យម៉ូដែល Sparse Attention ដំណើរការលើផ្នែកវែងនៃបរិបទជាមួយនឹងការផ្ទុកម៉ាស៊ីនមេតូច។
សម្រាប់ប្រតិបត្តិការបរិបទវែង អត្ថប្រយោជន៍នៃប្រព័ន្ធមានសារៈសំខាន់ណាស់។ ការធ្វើតេស្តបឋមរបស់ DeepSeek បង្ហាញថាតម្លៃនៃការហៅទូរសព្ទមុខងារសាមញ្ញ (API) អាចត្រូវបានកាត់បន្ថយរហូតដល់ពាក់កណ្តាលនៅក្នុងសេណារីយ៉ូនៃបរិបទវែង។
ការធ្វើតេស្តបន្ថែមទៀតគឺត្រូវការជាចាំបាច់ដើម្បីបង្កើតការវាយតម្លៃដ៏រឹងមាំមួយ ប៉ុន្តែដោយសារគំរូនេះបើកចំហ និងអាចប្រើប្រាស់បានដោយសេរីនៅលើ Hugging Face វាមិនគួរយូរប៉ុន្មានមុនពេលការធ្វើតេស្តភាគីទីបីអាចវាយតម្លៃការទាមទារនៅក្នុងក្រដាសនោះ។

គំរូថ្មីរបស់ DeepSeek គឺជារបកគំហើញថ្មីមួយក្នុងចំណោមរបកគំហើញថ្មីៗដែលដោះស្រាយបញ្ហានៃការចំណាយលើការសន្និដ្ឋាន - សំខាន់គឺតម្លៃម៉ាស៊ីនមេសម្រាប់ដំណើរការគំរូ AI ដែលបានបណ្តុះបណ្តាលជាមុន ផ្ទុយពីតម្លៃនៃការបណ្តុះបណ្តាលវា។
ក្នុងករណី DeepSeek អ្នកស្រាវជ្រាវកំពុងស្វែងរកមធ្យោបាយដើម្បីធ្វើឱ្យស្ថាបត្យកម្មប្លែងមូលដ្ឋានមានប្រសិទ្ធភាពជាងមុន ហើយបានរកឃើញថាការកែលម្អសំខាន់ៗចាំបាច់ត្រូវធ្វើ។
មានមូលដ្ឋាននៅក្នុងប្រទេសចិន DeepSeek គឺជាតួរលេខមិនធម្មតានៅក្នុងភាពឆ្កួតនៃ AI ជាពិសេសសម្រាប់អ្នកដែលមើលឃើញការស្រាវជ្រាវ AI ជាការប្រកួតប្រជែងរវាងសហរដ្ឋអាមេរិក និងចិន។ ក្រុមហ៊ុនបានធ្វើការផ្សព្វផ្សាយកាលពីដើមឆ្នាំនេះជាមួយនឹងម៉ូដែល R1 របស់ខ្លួន ដោយបានបណ្តុះបណ្តាលជាចម្បងដោយប្រើការរៀនពង្រឹងក្នុងការចំណាយទាបជាងដៃគូប្រកួតប្រជែងនៅសហរដ្ឋអាមេរិក។
ទោះជាយ៉ាងណាក៏ដោយ ម៉ូដែលនេះបានបរាជ័យក្នុងការជំរុញឱ្យមានបដិវត្តន៍ពេញលេញនៅក្នុងការបណ្តុះបណ្តាល AI ដែលអ្នកខ្លះបានព្យាករណ៍ ហើយក្រុមហ៊ុនបានដកថយបន្តិចម្តងៗពីការយកចិត្តទុកដាក់ក្នុងប៉ុន្មានខែបន្ទាប់។
វិធីសាស្រ្ត "ការយកចិត្តទុកដាក់តិចតួច" ថ្មីទំនងជាមិនបង្កឱ្យមានការខឹងសម្បារច្រើនដូច R1 ទេ ប៉ុន្តែវានៅតែអាចបង្រៀនអ្នកផ្តល់សេវាអាមេរិកនូវល្បិចដែលត្រូវការច្រើនដើម្បីជួយរក្សាតម្លៃការសន្និដ្ឋានទាប។
ប្រភព៖ https://khoahocdoisong.vn/deepseek-dao-tao-da-re-nay-con-co-ban-suy-luan-re-hon-post2149057353.html
Kommentar (0)