October 27, 2023
ថ្មីៗនេះខ្ញុំបានចូលទៅក្នុងពិភពនៃចក្ខុវិស័យកុំព្យូទ័រ ហើយបានរកឃើញគំរូភាសាចក្ខុវិស័យដ៏គួរឱ្យរំភើបមួយដែលមានឈ្មោះថា LLaVA ។ គំរូនេះបានធ្វើបដិវត្តដំណើរការនៃការបង្រៀនគំរូមួយដើម្បីទទួលស្គាល់លក្ខណៈពិសេសជាក់លាក់នៅក្នុងរូបភាពមួយ។
ជាប្រពៃណី ការបណ្តុះបណ្តាលគំរូដើម្បីសម្គាល់ពណ៌នៃរថយន្តនៅក្នុងរូបភាពមួយ តម្រូវឱ្យមានដំណើរការហ្វឹកហាត់ដ៏លំបាកពីទទេ។ ទោះជាយ៉ាងណាក៏ដោយជាមួយនឹងម៉ូដែលដូចជា LLaVA អ្វីដែលអ្នកត្រូវធ្វើគឺសួរវាជាមួយនឹងសំណួរដូចជា "តើរថយន្តពណ៌អ្វី?" និង voila! អ្នកទទួលបានចម្លើយរបស់អ្នក រចនាប័ទ្មសូន្យបាញ់។
វិធីសាស្រ្តនេះឆ្លុះបញ្ចាំងពីការរីកចម្រើនដែលយើងបានឃើញនៅក្នុងវិស័យដំណើរការភាសាធម្មជាតិ (NLP)។ ជំនួសឱ្យការបណ្ដុះបណ្ដាលគំរូភាសាពីដំបូង អ្នកស្រាវជ្រាវឥឡូវនេះកំពុងធ្វើការកែសម្រួលគំរូដែលបានបណ្តុះបណ្តាលជាមុន ដើម្បីបំពេញតម្រូវការជាក់លាក់របស់ពួកគេ។ ដូចគ្នានេះដែរ ចក្ខុវិស័យកុំព្យូទ័រកំពុងតែឈានទៅទិសដៅដូចគ្នា។
ស្រមៃថាអាចទាញយកការយល់ដឹងដ៏មានតម្លៃពីរូបភាពដោយប្រើប្រអប់បញ្ចូលអត្ថបទដ៏សាមញ្ញមួយ។ ហើយប្រសិនបើអ្នកត្រូវការដើម្បីលើកកម្ពស់ការអនុវត្តរបស់ម៉ូដែល, ការសម្រួលបន្តិចអាចធ្វើឱ្យអស្ចារ្យ. ជាការពិត ការពិសោធន៍របស់ខ្ញុំបានបង្ហាញថា ម៉ូដែលដែលបានកែសំរួល ថែមទាំងអាចដំណើរការបានប្រសើរជាងអ្នកដែលបានទទួលការបណ្តុះបណ្តាលតាំងពីដំបូង។ វាដូចជាមានអ្វីដែលល្អបំផុតនៃពិភពលោកទាំងពីរ!
ប៉ុន្តែនេះគឺជាកម្មវិធីផ្លាស់ប្តូរហ្គេមពិតប្រាកដ៖ គំរូមូលដ្ឋាន ដោយសារការបណ្តុះបណ្តាលយ៉ាងទូលំទូលាយរបស់ពួកគេលើសំណុំទិន្នន័យដ៏ធំ មានការយល់ដឹងគួរឱ្យកត់សម្គាល់អំពីតំណាងរូបភាព។ នេះមានន័យថាអ្នកអាចកែសម្រួលពួកវាដោយគ្រាន់តែឧទាហរណ៍មួយចំនួន ដោយមិនចាំបាច់ប្រមូលរូបភាពរាប់ពាន់សន្លឹក។ តាមការពិត ពួកគេអាចរៀនពីឧទាហរណ៍តែមួយ។
ល្បឿននៃការអភិវឌ្ឍគឺជាអត្ថប្រយោជន៍មួយទៀតនៃការប្រើប្រអប់បញ្ចូលអត្ថបទដើម្បីធ្វើអន្តរកម្មជាមួយរូបភាព។ ជាមួយនឹងវិធីសាស្រ្តនេះ អ្នកអាចបង្កើតគំរូនៃចក្ខុវិស័យកុំព្យូទ័របានយ៉ាងឆាប់រហ័សក្នុងរយៈពេលប៉ុន្មានវិនាទី។ វាលឿន មានប្រសិទ្ធភាព ហើយវាកំពុងធ្វើបដិវត្តលើវិស័យនេះ។
ដូច្នេះ តើយើងកំពុងឈានទៅអនាគតដែលគំរូមូលដ្ឋាននាំមុខក្នុងចក្ខុវិស័យកុំព្យូទ័រ ឬនៅតែមានកន្លែងសម្រាប់បណ្ដុះបណ្ដាលគំរូពីដំបូង? ចម្លើយចំពោះសំណួរនេះនឹងកំណត់អនាគតនៃចក្ខុវិស័យកុំព្យូទ័រ។
PS ខ្ញុំចង់ដោតកម្មវិធីប្រភពបើកចំហរបស់ខ្ញុំដែលហៅថា Datasaurus ដោយឥតអៀនខ្មាស។ វាប្រើប្រាស់ថាមពលនៃគំរូភាសាចក្ខុវិស័យ ដើម្បីជួយវិស្វករទាញយកការយល់ដឹងពីរូបភាពបានយ៉ាងឆាប់រហ័ស។ ខ្ញុំចង់ចែករំលែកគំនិតរបស់ខ្ញុំ និងចាប់ផ្តើមការសន្ទនាអំពីអនាគតនៃចក្ខុវិស័យកុំព្យូទ័រ។ តោះនិយាយគ្នា!
វណ្ណក្រចាបន្ទូលមកពីកាមពត ហើយរស់នៅភ្នំពេញ។ គាត់ជាអ្នកមានភាពចូលចិត្តក្នុងការលេងហ្គេម និងបកប្រែភាសា។ គាត់ធ្វើការបកប្រែកម្មវិធីហ្គេមនៅកម្ពុជា និងបង្កើតការទាក់ទាញជាមួយគេហទំព័រប្រាណការណ៍។