ការអាប់ដេត Google Gemini ប្រើគំរូរូបភាព "ណាណូចេក" ដែលបង្កើតឡើងដោយ Google DeepMind ។ ឥឡូវនេះមុខងារនេះអាចប្រើបានជាសកលសម្រាប់ទាំងអ្នកប្រើប្រាស់ឥតគិតថ្លៃ និងបង់ប្រាក់។ កម្លាំងដ៏ធំបំផុតរបស់វាគឺសមត្ថភាពរបស់វាក្នុងការរក្សាមុខ និងវត្ថុឱ្យជាប់លាប់ក្នុងរូបភាព ដែលជាឧបករណ៍ AI ផ្សេងទៀតតែងតែជួបការលំបាក។
Nicole Brichtova អ្នកដឹកនាំផលិតផលនៅ DeepMind បាននិយាយថា "យើងពិតជាបានជំរុញគុណភាពរូបភាព និងសមត្ថភាពរបស់ម៉ូដែលក្នុងការធ្វើតាមការណែនាំ" ។ "ការអាប់ដេតនេះធ្វើឱ្យការកែសម្រួលកាន់តែរលូន ហើយលទ្ធផលគឺល្អគ្រប់គ្រាន់ដើម្បីប្រើប្រាស់សម្រាប់គោលបំណងណាមួយ។"
រក្សា "អ្នក" នៅក្នុងរូបថតនីមួយៗ
រឿងមួយដែលធ្វើឱ្យរូបថត AI មើលទៅក្លែងក្លាយគឺថា ព័ត៌មានលម្អិតតូចៗត្រូវបានបង្ខូចទ្រង់ទ្រាយ។ Google និយាយថា Gemini ដោះស្រាយបញ្ហានេះដោយអនុញ្ញាតឱ្យអ្នកផ្លាស់ប្តូរឈុតទាំងមូលខណៈពេលដែលរក្សាមុខនិងការបញ្ចេញមតិដូចគ្នា។ អ្នកអាចសាកល្បងម៉ូដសក់ថ្មី ប្តូរពណ៌ជញ្ជាំង ឬនាំសត្វចិញ្ចឹមចូលក្នុងឈុតដោយមិនបារម្ភពីការបង្ខូចទ្រង់ទ្រាយរូបភាព។

Gemini ក៏អនុញ្ញាតឱ្យអ្នកបញ្ចូលរូបថតជាច្រើនដើម្បីបញ្ចូលគ្នាទៅជាមួយ ដូចជាការផ្សំរូបបញ្ឈរជាមួយឆ្មារបស់អ្នក ដើម្បីបង្កើតរូបថតដែលអ្នកទាំងពីរជិះជាមួយគ្នានៅលើផ្លូវ។
Gemini គាំទ្រការកែសម្រួលពហុវេន ដែលអនុញ្ញាតឱ្យអ្នកប្រើប្រាស់បន្ថែមរាល់ព័ត៌មានលម្អិតទៅកន្លែងមួយ៖ ពីផ្ទាំងរូបភាព គ្រឿងសង្ហារឹម ដើម្បីលាបពណ៌។ ចំណុចបូកគឺថាមានតែផ្នែកដែលត្រូវកែសម្រួលប៉ុណ្ណោះដែលនៅសល់នៅដដែល។
លើសពីនេះទៀត Gemini អាចលាយរចនាប័ទ្មរវាងរូបថត។ ជាឧទាហរណ៍ បង្វែរស្បែកជើងកវែងទឹកភ្លៀងទៅជាស្បែកជើងបោះពុម្ពផ្កា ឬបង្កើតរ៉ូបដែលមានលំនាំមេអំបៅ។
ការប្រកួតប្រជែងបង្កើតរូបភាព AI ក្នុងចំណោមក្រុមហ៊ុនបច្ចេកវិទ្យាយក្ស
ការធ្វើឱ្យប្រសើរឡើងរបស់ Google កើតឡើងនៅពេលដែលសង្រ្គាមរូបភាព AI កាន់តែក្តៅ។ OpenAI ពីមុនបានបើកដំណើរការ GPT-4o ដែលអាចបង្កើតរូបភាពដោយផ្ទាល់ និងបានរីករាលដាលជាមួយនឹងស៊េរីនៃស្ទីលស្ទូឌីយោ Ghibli memes ។ នាយកប្រតិបត្តិ Sam Altman បានបង្ហាញថាចំនួនអ្នកប្រើប្រាស់បានកើនឡើងយ៉ាងខ្លាំងដែល GPU របស់ក្រុមហ៊ុនស្ទើរតែ "រលាយ" ។
ដើម្បីបន្ត Meta បានប្រកាសពីភាពជាដៃគូជាមួយ Midjourney ខណៈពេលដែលក្រុមហ៊ុនអាឡឺម៉ង់ Black Forest Labs ដែលចាប់ផ្តើមជាមួយម៉ូដែល FLUX របស់ខ្លួនកំពុងគ្របដណ្តប់លើតារាងជាច្រើន។

Google សង្ឃឹមថា Gemini អាចបិទគម្លាតជាមួយ ChatGPT ។ យោងតាមនាយកប្រតិបត្តិ Sundar Pichai បច្ចុប្បន្ន Gemini មានអ្នកប្រើប្រាស់ប្រចាំខែចំនួន 450 លាននាក់ ទាបជាង ChatGPT ដែលមានអ្នកប្រើប្រាស់ច្រើនជាង 700 លាននាក់ក្នុងមួយសប្តាហ៍។
Brichtova បាននិយាយថា Gemini ត្រូវបានរចនាឡើងសម្រាប់សេណារីយ៉ូក្នុងពិភពពិត ចាប់ពីការមើលឃើញបន្ទប់ទទួលភ្ញៀវ និងសួនច្បារ រហូតដល់ការបង្កើតរូបថតកម្សាន្ត។ ម៉ូដែលនេះមាន “ចំណេះដឹង ពិភពលោក ” ប្រសើរជាងមុន ហើយអាចបញ្ចូលគ្នានូវរូបថត និងក្ដារលាយពណ៌ជាច្រើនចូលទៅក្នុងការបង្ហាញតែមួយ។
ទោះជាយ៉ាងណាក៏ដោយ Google ក៏កំណត់ដែនកំណត់យ៉ាងតឹងរ៉ឹងផងដែរ។ រូបភាពដែលបានបង្កើតទាំងអស់មាន watermark ច្បាស់លាស់ និងលាក់អត្តសញ្ញាណនៅក្នុងទិន្នន័យមេតា។ ក្រុមហ៊ុនហាមឃាត់យ៉ាងតឹងរ៉ឹងនូវការបង្កើតរូបភាពរសើបដោយអចេតនា ដើម្បីការពារការរំលោភបំពានក្លែងក្លាយ។
Google ពីមុនបានសុំទោសចំពោះរូបភាពប្រវត្តិសាស្ត្រមិនត្រឹមត្រូវរបស់ Gemini ។ លើកនេះ ក្រុមហ៊ុនជឿជាក់ថា វាបានធ្វើឱ្យមានតុល្យភាពរវាងការច្នៃប្រឌិត និងសុវត្ថិភាព។ Brichtova បានសង្កត់ធ្ងន់ថា "យើងចង់ឱ្យអ្នកប្រើប្រាស់មានភាពច្នៃប្រឌិត ប៉ុន្តែមិនមែនអ្វីៗទាំងអស់ត្រូវបានអនុញ្ញាតទេ" ។
ជាមួយនឹង Gemini 2.5 Flash Image Google កំពុងភ្នាល់លើការបង្កើនបទពិសោធន៍កែរូបថត AI ដោយសង្ឃឹមថានឹងរក្សាអ្នកប្រើប្រាស់ចាស់ៗ និងទាក់ទាញអ្នកថ្មីក្នុងការប្រណាំងបច្ចេកវិទ្យាដ៏ខ្លាំងក្លាជាមួយ OpenAI, Meta និងដៃគូប្រកួតប្រជែងផ្សេងទៀត។
(យោងតាម TechCrunch, Tom's Guide)

ប្រភព៖ https://vietnamnet.vn/google-gemini-nang-tam-ai-tao-anh-doi-nen-kieu-toc-chi-bang-mot-cau-lenh-2436782.html
Kommentar (0)