மெட்டா (Meta) அறிமுகப்படுத்தியுள்ள Llama 3.1 : திறந்த மூல செயற்கை நுண்ணறிவு மாதிரி (open-source AI model) என்றால் என்ன? அது எப்படி உலகை மாற்ற முடியும்? - பிஜின் ஜோஸ்

 மெட்டா (Meta) நிறுவனம் அறிமுகப்படுத்தியுள்ள புதிய திறந்த மூல செயற்கை நுண்ணறிவு மாதிரி (open source AI model) Llama 3.1 ஐ அதன் போட்டியாளர்களை விட முன்னிலையில் உள்ளது. திறந்த மூல செயற்கை நுண்ணறிவு ஏன் நமது எதிர்காலத்திற்கு முக்கியமானது என்பதை ஜுக்கர்பெர்க் (Zuckerberg) கோடிட்டுக் காட்டுகிறார். 


செயற்கை நுண்ணறிவு பந்தயம் (AI race) மெட்டா அதன் மிகப்பெரிய மற்றும்  சிறந்த திறந்த மூல செயற்கை நுண்ணறிவு மாதிரி லாமா-23 (Llama 3.1) -ஐ செவ்வாய்க்கிழமை (ஜூலை 3.1) வெளியிட்டதன் மூலம் மிகவும் சுவாரஸ்யமாகியுள்ளது. 


Meta இன் சமீபத்திய செயற்கை நுண்ணறிவு மாதிரி சில செயல்திறன் வரையறைகளில் OpenAI மற்றும் பிற முக்கிய போட்டியாளர்களை விட சிறப்பாக செயல்பட்டதாகக் கூறப்படுகிறது.


திறந்த மூல செயற்கை நுண்ணறிவு (open source AI) பற்றி நமக்கு என்ன தெரியும்? Meta-ன் புதிய திறந்த மூல செயற்கை நுண்ணறிவு மாதிரி அதன் சக போட்டியாளர்களிடமிருந்து எவ்வாறு வேறுபடுகிறது? 


திறந்த மூல செயற்கை நுண்ணறிவு மாதிரி (open source AI model) என்றால் என்ன?


திறந்த மூல செயற்கை நுண்ணறிவு (open source AI) என்பது ஒரு வகை செயற்கை நுண்ணறிவு தொழில்நுட்பமாகும். இது பல திறந்த மூல உரிமங்களின் கீழ் வழங்கப்படும் வணிக மற்றும் வணிகமற்ற பயன்பாட்டிற்கு பொதுமக்களுக்கு கிடைக்க வழிவகுக்கிறது.


ஒரு திறந்த மூல செயற்கை நுண்ணறிவு மாதிரி (open source AI model) உரிமங்களின் கீழ் பயனர்களுக்கு அதன் பகுதிகள் முழுவதும் கிடைப்பதால் வகைப்படுத்தப்படுகிறது. இதன்மூலம், கணினி எவ்வாறு செயல்படுகிறது மற்றும் அதன் வகைகளை ஆய்வு செய்ய அனுமதிக்கிறது. இந்த மாதிரிகள் தரவுத்தொகுப்புகள் (datasets), பயன்படுத்தத் தயாராக உள்ள இடைமுகங்கள் (ready-to-use interfaces) மற்றும் மென்பொருள் உருவாக்குபவர்கள் (developers) தங்கள் பயன்பாட்டு மேம்பாட்டு பயணத்தைத் தொடங்க உதவும் முன் கட்டமைக்கப்பட்ட வழிமுறைகளுடன் வருகின்றன.  


இத்தகைய மாதிரிகள் மென்பொருள் உருவாக்குபவர்கள் தங்கள் குறிப்பிட்ட தேவைகளுக்கு ஏற்ப தங்கள் பரிந்துரைகளையும் முடிவுகளையும் திருத்துவதற்கு அவற்றை மாற்றியமைக்க அனுமதிக்கின்றன. இந்த மாற்றியமைக்கப்பட்ட பதிப்புகள் பின்னர் எந்த நோக்கத்திற்காகவும் பொதுமக்களுடன் பகிரப்படலாம்.


கடந்த மூன்று ஆண்டுகளில், திறந்த மூல செயற்கை நுண்ணறிவு (open source AI) தொழில்நுட்பங்களைப் பயன்படுத்தும் நிறுவனங்கள் மற்றும் சுதந்திரமாக உருவாக்குபவர்கள் எண்ணிக்கையில் குறிப்பிடத்தக்க அதிகரிப்பு ஏற்பட்டுள்ளது. 


வர்த்தகரீதியான மற்றும் மூடிய விற்பனையாளர்களைச் (closed vendors) சார்ந்திருப்பதைத் தவிர்க்க நிறுவனங்கள் விரும்புவதால் இந்த உயர்வு ஏற்பட்டுள்ளதாக மெட்டா தலைமை நிர்வாக அதிகாரி மார்க் ஜுக்கர்பெர்க் (Mark Zuckerberg) கூறுகிறார். இதில் மாதிரிகளில் மாற்றங்கள் (model alterations) மற்றும் சேவை இடையூறுகள் (service disruption) போன்ற சிக்கல்களைத் தவிர்க்க அவர்கள் விரும்புகிறார்கள். அதற்கு பதிலாக, அவர்கள் திறந்த மூல மாதிரிகளை விரும்புவதால், அதிக நெகிழ்வுத்தன்மையையும், கட்டுப்பாட்டையும் வழங்குகின்றன.


ஜுக்கர்பெர்க்கின் கூற்றுப்படி, நிறுவனங்கள் பல்வேறு பணிகளுக்கு வெவ்வேறு அளவிலான மாதிரிகளைப் பயன்படுத்தும்போது அவற்றின் குறிப்பிட்ட தேவைகளைப் பூர்த்தி செய்ய தங்கள் சொந்த மாதிரிகளைப் பயிற்றுவிக்க வேண்டும். இவர்கள் வெவ்வேறு பணிகளுக்கு வெவ்வேறு அளவிலான மாதிரிகளைப் பயன்படுத்த வேண்டும். உபகரணங்களில் (on-device) பயன்படுத்த மற்றும் வகைப்படுத்தல் பணிகளுக்கு (classification tasks) சிறிய மாதிரிகள் நல்லது. பெரிய மாதிரிகள் மிகவும் சிக்கலான பணிகளை சிறப்பாக கையாளுகின்றன.


Meta நிறுவன தலைமை நிர்வாக அதிகாரி திறந்த மூல  சூழல் அமைப்புகளில் முதலீடு செய்வது நன்மை பயக்கும் என்ற வழக்கை வாதிடுகிறார். இது நீண்ட கால வளர்ச்சி மற்றும் விரைவான முன்னேற்றத்திற்கு சாதகமானதாக இருக்கக்கூடும். திறந்த மூல தொழில்நுட்பத்தின் வெளிப்படைத்தன்மை மற்றும் பாதுகாப்பு மாதிரிகள் எந்த உள்கட்டமைப்பிலும் பாதுகாப்பாக இயங்க உதவுகிறது.


லாமா 3.1 (Llama 3.1) பற்றி நமக்கு என்ன தெரியும்?


Llama 3.1 என்பது Meta-ன் மிகப்பெரிய திறந்த மூல செயற்கை நுண்ணறிவு மாதிரியாகும். மேலும், OpenAI இன் GPT-4o மற்றும் Anthropic இன் Claude 3.5 Sonnet போன்றவற்றை விட பல வரையறைகளில் சிறப்பாக செயல்பட்டதாக நிறுவனம் கூறுகிறது.


புதிய லாமா 3.1 (Llama 3.1) மாதிரிகள் லாமா-3 மாதிரிகளுடன் ஒப்பிடும்போது மிகவும் சிக்கலானவை என்று கூறப்படுகிறது. 


Zuckerberg தனது வலைப்பதிவில் குறிப்பிடுகையில், இந்த ஆண்டு இறுதிக்குள் Meta செயற்கை நுண்ணறிவானது ChatGPT ஐ விட சிறப்பான வகையில் மிகவும் பரவலாகப் பயன்படுத்தப்படும் செயற்கை நுண்ணறிவு உதவியாளராக இருக்கும் என்று கணித்துள்ளார். Meta Llama-அடிப்படையிலான Meta செயற்கை நுண்ணறிவு உதவியாளரை அதிக நாடுகள் மற்றும் மொழிகளில் வெளியிட்டவுடன் இது சாத்தியமாகும்.


பொதுவாக, நாங்கள் Llama 3.1 405B, முதல் எல்லை-நிலை (first frontier-level) திறந்த மூல செயற்கை நுண்ணறிவு மாதிரியையும், புதிய மற்றும் மேம்படுத்தப்பட்ட Llama 3.1 70B மற்றும் 8B மாதிரிகளையும் வெளியிடுகிறோம் என்று Meta தலைமை நிர்வாக அதிகாரி கூறினார். "வர்த்தக ரீதியிலான மூடிய மாதிரிகளுடன் ஒப்பிடும்போது கணிசமாக சிறந்த செலவு / செயல்திறனைக் கொண்டிருப்பதோடு மட்டுமல்லாமல், 405B மாதிரி திறந்திருப்பது சிறிய மாதிரிகளை நன்றாகச் சரிசெய்வதற்கும் தேர்ந்தெடுப்பதற்கும் சிறந்த தேர்வாக அமையும்.


Llama 3.1 405B இல் அனுமானத்தை இயக்குவது செலவு குறைந்ததாகும் என்று ஜுக்கர்பெர்க் கூறினார். இந்த செயல்முறை இயந்திர கற்றல் மாதிரிகளைப் பயிற்றுவிக்கப் பயன்படுகிறது. OpenAI இன் GPT-4 போன்ற மூடிய மாதிரிகளைப் பயன்படுத்துவதை விட இது 50 சதவீதம் மலிவானது.  


கூடுதலாக, லாமா(Llama), கார்டு (Llama Guard) போன்ற அமைப்புகளுடன் வருகிறது. இந்த அமைப்பு எதிர்பாராத தீங்குகளிலிருந்து பாதுகாக்க முடியும். இந்த தீங்குகளில் மோசமான ஆலோசனை அல்லது திட்டமிடப்படாத சுய பிரதிபலிப்பு (unintended self-replication) ஆகியவை அடங்கும். இவை முக்கிய கவலைகள் என்று அவர் குறிப்பிட்டார்.


மெட்டா ஏன் திறந்த மூல செயற்கை நுண்ணறிவை ஆதரிக்கிறது ? 


ஜுக்கர்பெர்க்கின் கூற்றுப்படி, மெட்டாவின் சிறந்த கவனம் தொழில்நுட்பங்களுக்கான அணுகலை வழங்குவதன் மூலமும், போட்டியாளர்களால் வழங்கப்படும் மூடிய  சூழல் அமைப்புகளால் (closed ecosystems) மட்டுப்படுத்தப்படாமல் சிறந்த தயாரிப்பு வளர்ச்சியை அனுமதிப்பதன் மூலமும் மக்களுக்கு சிறந்த அனுபவங்களையும் சேவைகளையும் உருவாக்குவதாகும். 

 

லாமாவின் (Llama) திறந்த ஆதாரம், அவரைப் பொறுத்தவரை, சிறந்த தொழில்நுட்பங்களுக்கு நீண்டகால அணுகலை உறுதி செய்யக்கூடிய கருவிகள் மற்றும் மேம்பாடுகளின் சுற்றுச்சூழல் அமைப்பை ஊக்குவிக்கிறது. 


மற்றொரு அம்சம் திறந்த மூல மாதிரியின் செலவு-செயல்திறன் ஆகும். லாமா மாதிரியின் (Llama model) திறந்த மூல தன்மை மெட்டாவின் அடிமட்டம் அல்லது ஆராய்ச்சியில் முதலீடுகளை பாதிக்காது என்றாலும், ஜுக்கர்பெர்க் மெட்டாவின் வெற்றிகரமான திறந்த மூல திட்டங்களான கணினித் திட்டம்  (Open Compute Project),  PyTorch மற்றும்  React  போன்ற கருவிகளின் வரலாற்றை எடுத்துக்காட்டினார். ஏனெனில், இந்த திட்டங்கள் பில்லியன்களை மிச்சப்படுத்தியது மற்றும் மெட்டாவிற்கு புதுமைகளை உருவாக்கியது.

திறந்த மூல செயற்கை நுண்ணறிவு அதன் வெளிப்படைத்தன்மை மற்றும் பரந்த ஆய்வு காரணமாக பாதுகாப்பானது என்று Meta தலைமை நிர்வாக அதிகாரி குறிப்பிடுகிறார். இது சிறிய நிறுவனங்களின் அச்சுறுத்தல்களுக்கு எதிராக பெரிய நிறுவனங்களை பாதுகாக்க உதவுகிறது. இது பாதுகாப்பு மற்றும் நிலைத்தன்மையை ஊக்குவிக்கிறது.  


திறந்த மூல செயற்கை நுண்ணறிவில் முதலீடு செய்வது எதிர்கால கண்டுபிடிப்புகளுக்கு வழிவகுக்கும் என்று ஜூக்கர்பெர்க் (Zuckerberg) வாதிடுகிறார். இந்த அணுகுமுறை புத்தொழில் நிறுவனங்கள் (startups), பல்கலைக்கழகங்கள் (universities) மற்றும் குறைந்த வளங்களைக் கொண்ட நாடுகளுக்கு பயனளிக்கும் என்று அவர் நம்புகிறார். இந்த முதலீடு அனைவருக்கும் பொருளாதார வாய்ப்புகளை உருவாக்க முடியும். அதன் பயன்பாடுகள் மனித உற்பத்தித்திறன் மற்றும் படைப்பாற்றலை மேம்படுத்தும், அதே நேரத்தில் நமது வாழ்க்கைத் தரத்தையும் மேம்படுத்தி, பொருளாதார வளர்ச்சியையும் அறிவியல் ஆராய்ச்சியையும் துரிதப்படுத்தும் என்று எதிர்ப்பார்க்கப்படுகிறது.



Original article:

Share: