Google DeepMind-ன் ஜெனி (Genie) என்பது, படத் தூண்டுதல்களிலிருந்து மெய்நிகர் உலகங்களை உருவாக்கும் செயற்கை நுண்ணறிவு மாதிரி -பிஜின் ஜோஸ்

 Google DeepMind நிறுவனம் Genie என்ற புதிய செய்ற்கை நுண்ணறிவு மாதிரியை அறிமுகம் செய்துள்ளது. இந்த மாதிரி ஒரு உரை (text) அல்லது பட (image) கட்டளையின் (prompt) மூலம்  வீடியோ கேம்களை (video games) உருவாக்க முடியும். இது விளையாட்டை உருவாக்கும் விதிகள், கூறுகள் மற்றும் செயல்முறைகளை உள்ளடக்கிய விளையாட்டு இயக்கவியலில் குறிப்பாக எந்த பயிற்சியும் பெறாமல் நடைபெறுகிறது.





ஜெனி (Genie) என்றால் என்ன?


அதிகாரப்பூர்வ Google DeepMind இணையதளத்தில் கூறப்பட்டுள்ளபடி, Genie என்பது இணையம் சார்ந்த வீடியோக்களில் பயிற்சியளிக்கப்பட்ட ஒரு அடிப்படை உலக மாடல் (foundation world model) ஆகும். இந்த மாதிரியானது,  செயற்கை படங்கள், புகைப்படங்கள் மற்றும் ஓவியங்களைப் பயன்படுத்தி வரம்பற்ற அளவிலான விளையாடக்கூடிய (செயல்-கட்டுப்படுத்தக்கூடிய) உள்ளடக்கங்களை உருவாக்கும் திறனைக் கொண்டுள்ளது.


'ஜெனி: உருவாக்கும் ஊடாடும் சூழல்கள்' (Genie: Generative Interactive Environments) என்ற தலைப்பிலான ஆராய்ச்சிக் கட்டுரை, பெயரிடப்படாத இணைய வீடியோக்களின் மேற்பார்வை இல்லாமல் பயிற்சி பெற்ற முதல் உருவாக்கும் ஊடாடும் சூழலாக Genie-யை அறிமுகப்படுத்துகிறது. Genie-ல் 11 பில்லியன் அளவுருக்கள் உள்ளன மற்றும் ஒரு ஸ்பேஷியோ டெம்போரல் வீடியோ டோக்கனைசர் (spatiotemporal video tokenizer), ஒரு ஆட்டோரெக்ரசிவ் டைனமிக்ஸ் மாடல் (autoregressive dynamics model) மற்றும் எளிய, அளவிடக்கூடிய மறைந்த செயல் மாதிரி ஆகியவற்றைக் கொண்டுள்ளது.


இந்த தொழில்நுட்ப விவரக்குறிப்புகள் மூலம், பயிற்சி, அடையாளக் குறியீடு அல்லது வேறு எந்த தளம் குறிப்பிட்ட தேவைகள் இல்லாமல், தொடர்ச்சியான அடிப்படையில் உருவாக்கப்பட்ட சூழல்களில் Genie செயல்பட முடியும்.


ஜெனி (Genie) என்ன செய்கிறது?


ஆராய்ச்சிக் கட்டுரை Genie-யை ஒரு புதுமையான ஜெனரேட்டிவ் செயற்கை நுண்ணறிவு மாதிரி என்று விவரிக்கிறது. இந்த மாதிரியானது, குழந்தைகள் உட்பட எவரையும் மனித வடிவமைப்பாளர்களால் உருவாக்கப்பட்ட உலகங்களைப் போன்ற புதிய உலகங்களை உருவாக்கவும் ஆராயவும் அனுமதிக்கிறது. Genie வீடியோ தரவுகளுடன் மட்டுமே பயிற்சி பெற்றிருந்தாலும், இது ஒரு எளிய படத் தூண்டுதலிலிருந்து பரந்த அளவிலான ஊடாடும் மற்றும் கட்டுப்படுத்தக்கூடிய சூழல்களை உருவாக்க முடியும்.


எளிமையான சொற்களில், உரை, படங்கள் மற்றும் வீடியோக்களை உருவாக்கக்கூடிய பல செயற்கை நுண்ணறிவு மாதிரிகள் தோன்றியிருந்தாலும், Genie தனித்து நிற்கிறது. இது ஒரு படத்திலிருந்து விளையாடக்கூடிய சூழல்களை உருவாக்குகிறது. "ஹாரி பாட்டர் அண்ட் தி பிலாசஃபர்ஸ் ஸ்டோனில்" (Harry Potter and the Philosopher’s stone) உள்ள காட்சியை கற்பனை செய்து பாருங்கள், அங்கு ஹாரியும் அவரது நண்பர்களும் ஹாக்வார்ட்ஸில் (Hogwarts) நுழையும்போது தங்கள் வரையறைகளுக்குள் நகரும் ஓவியங்களைப் பார்க்கிறார்கள். Genie அசைவற்ற பிம்பங்களை உயிர்ப்பிப்பதன் மூலம் இதேபோன்ற ஒன்றைச் செய்வதுடன், சுற்றியுள்ள முழு உலகங்களையும் உருவாக்குகிறது.


நிஜ உலக புகைப்படங்கள் மற்றும் ஓவியங்கள் உட்பட Genie இதற்கு முன்பு சந்திக்காத படங்களுடன் வேலை செய்ய முடியும் என்று Google DeepMind கூறுகிறது. இந்த திறன் மக்கள் அவர்கள் கற்பனை செய்த மெய்நிகர் உலகங்களுடன் தொடர்பு கொள்ள குறிப்பிடப்படுகிறது. Genie-யை ஒரு அடித்தள உலக மாதிரியாக (foundation world model) வரையறுக்கிறது. ஆராய்ச்சிக் கட்டுரையில் விவரிக்கப்பட்டுள்ளபடி, Genie-யின் பயிற்சி, முதன்மையாக 2D இயங்குதள விளையாட்டுகள் மற்றும் ரோபாட்டிக்ஸ் வீடியோக்களை உள்ளடக்கியது.  இருந்தபோதிலும், Genie ஒரு பொதுவான முறையைப் பயன்படுத்தி பயிற்சி பெறுகிறது. இதன் பொருள் இது பல்வேறு களங்களில் செயல்பட முடியும். கூடுதலாக, இது அளவிடக்கூடியது. மேலும், இணையத்திலிருந்து இன்னும் பெரிய தரவுத்தொகுப்புகளைக் கையாளும் திறன் கொண்டது.


Genie ஏன் முக்கியமானது?


Genie-யின் மிகவும் குறிப்பிடத்தக்க அம்சம், இணைய வீடியோக்களிலிருந்து மட்டுமே விளையாட்டு கதாபாத்திரங்களுக்கான கட்டுப்பாடுகளைக் கற்றுக் கொள்ளும் மற்றும் பிரதிபலிக்கும் திறன் குறிப்பிடத்தக்கது. ஏனெனில் இந்த வீடியோக்கள் நிகழ்த்தப்பட்ட செயல்களை விவரிக்கும் அல்லது படத்தின் எந்தப் பகுதி கட்டுப்பாட்டுக்கு உட்பட்டது என்பதைக் குறிக்கும் அடையாளக் குறியீடுகளுடன் வரவில்லை.


இந்த மாதிரியின் காட்சியானது, கருத்து கண்காணிப்பின் எந்தப் பகுதிகளைக் கட்டுப்படுத்த முடியும் என்பதைப் புரிந்துகொள்ளும் திறன் கொண்டது மற்றும் வெவ்வேறு உருவாக்கப்பட்ட சூழல்களில் சீராக இருக்கும் பல்வேறு உள்ளுறை செயல்களை ஊகிக்க முடியும். இதன் பொருள், ஒரே மாதிரியான செயல்கள் தூண்டுதல்களாகப் பயன்படுத்தப்படும் பல்வேறு படங்களில் ஒத்த நடத்தைகளை உருவாக்க முடியும்.


Google DeepMind-ன் கூற்றுப்படி, Genie-ன் மாதிரி மிகவும் தனித்துவமான அம்சம், ஒரு படத்தின் அடிப்படையில் முற்றிலும் புதிய ஊடாடும் சூழலை உருவாக்கும் திறன் ஆகும். இந்த கண்டுபிடிப்பு மெய்நிகர் உலகங்களை உருவாக்குவதற்கும், ஆராய்வதற்கும் புதிய சாத்தியங்களைத் திறக்கிறது. இதை வெளிப்படுத்த, ஆராய்ச்சியாளர்கள் உரையிலிருந்து-பட மாதிரி (text-to-image model) 2 உடன் ஒரு படத்தை உருவாக்கினர். பின்னர் இந்த படத்தை மெய்நிகர் உலகங்களை உருவாக்க பயன்படுத்தினர்.  இது, படைப்பு மெய்நிகர் சுற்றுச்சூழல் உருவாக்கத்திற்கான நோக்கத்தை விரிவுபடுத்துகிறது. 


Genie எவரையும் தங்கள் சொந்த கற்பனையான மெய்நிகர் உலகங்களை வடிவமைப்பதற்கான தொழில்நுட்ப அணுகலை வழங்குகிறது. புதிய உலக மாதிரிகளைக் (new world models) கற்றுக்கொள்வதற்கும் உருவாக்குவதற்கும் அதன் திறன் பொதுவான செயற்கை நுண்ணறிவு முகவர்களின் (general AI agents) வளர்ச்சியை நோக்கிய ஒரு முக்கிய படியாகும். இதில் உள்ள முகவர்கள் (AI agents) சுதந்திரமாக செயல்படுகிறார்கள். மேலும், தங்களைச் சுற்றியுள்ள சூழலை உணருவதன் மூலம் தங்கள் சுற்றுப்புறங்களுடன் தொடர்பு கொள்கிறார்கள். 


பிஜின் ஜோஸ் ஒரு தொழில்நுட்ப பத்திரிகையாளர், அவர் புது தில்லியில் உள்ள இந்தியன் எக்ஸ்பிரஸ் ஆன்லைனில் உதவி ஆசிரியராக பணிபுரிகிறார். 




Original article:

Share: