எப்படி பெரிய மொழி மாதிரிகள் (LLM) இந்தியாவின் செயற்கை நுண்ணறிவு பாய்ச்சலுக்கு வழிவகுக்கும்? -சார்லஸ் அசிசி

 தொழில்நுட்பத்தில் அடுத்த பெரிய அதிகாரப் போராட்டம் வேகம் அல்லது அளவைப் பற்றியதாக இருக்காது. இது AI பயன்படுத்தும் மொழியைப் பற்றியதாக இருக்கும். தொழில்நுட்பத்தில் நம்பிக்கை மிகவும் மனிதாபிமானமான ஒன்றிலிருந்து தொடங்குகிறது. அவை, புரிந்து கொள்ளப்பட்ட உணர்வு (being understood) ஆகும்.


உங்கள் மொழியைப் பேசும் ஒரு மருத்துவரை நீங்கள் நம்புகிறீர்கள். உங்கள் சூழ்நிலையை அறிந்த ஒரு வங்கியாளரை நீங்கள் நம்புகிறீர்கள். எனவே, நீங்கள் யார், நீங்கள் எங்கிருந்து வருகிறீர்கள், அல்லது உங்கள் வார்த்தைகள் எதைக் குறிக்கின்றன என்று தெரியாத ஒரு வழிமுறையை ஏன் நம்ப வேண்டும்?


உலகளாவிய தெற்கு முழுவதும் உள்ள அரசாங்கங்கள், உருவாக்குபவர்கள் (developers) மற்றும் சமூகங்கள் (communities) இந்தக் கேள்வியைக் கேட்கின்றன. பெரிய மொழி மாதிரிகள் (LLMகள்) எவ்வளவு சக்திவாய்ந்தவை என்பதை அவர்கள் கண்டிருக்கிறார்கள். ஆனால், இந்த மாதிரிகள் பெரும்பாலும் ஆங்கிலம் பேசத் தெரியாத அல்லது சிலிக்கான் பள்ளத்தாக்கில் வசிக்காத மக்களுக்குப் பொருத்தமற்றவை என்பதையும் அவர்கள் காண்கிறார்கள்.


இந்தியாவில், இதுவரை முக்கிய பதில் BharatGPT ஆகும். இது CoRover.ai போன்ற புத்தொழில் நிறுவனங்கள், பாஷினி (Bhashini) போன்ற அரசாங்க ஆதரவு தளங்கள் மற்றும் IITகள் போன்ற கல்வி நிறுவனங்களுக்கு இடையிலான கூட்டு முயற்சியாகும். உலகளாவிய தரத்தில் ChatGPT உடன் போட்டியிடுவது இதன் குறிக்கோள் அல்ல. மாறாக, இது நாட்டிற்குள் உள்ள பிரச்சினைகளைத் தீர்ப்பதை நோக்கமாகக் கொண்டுள்ளது. இது குடிமக்கள் இந்தியில் அரசாங்க படிவங்களை நிரப்ப உதவுகிறது. இது தமிழில் இரயில்வே தொடர்பான கேள்விகளை தானியங்குபடுத்துகிறது. இது பிற பிராந்திய மொழிகளிலும் குரல் உதவியாளர்களை செயல்படுத்துகிறது. CoRover ஏற்கனவே இரயில்வே, காப்பீடு மற்றும் வங்கி போன்ற துறைகளில் பன்மொழி தானியங்கி பதிலுரைப்பான்களை (multilingual chatbots) அறிமுகப்படுத்தியுள்ளது. இதன் முக்கிய மதிப்பு தானியங்கியில் (automation) மட்டுமல்ல. இது முக்கியமான புரிதலில் உள்ளது.


இது இந்தியாவில் மட்டும் நடக்கும் ஒன்று அல்ல. தென்னாப்பிரிக்காவில், லெலாபா AI InkubaLM-ஐ உருவாக்குகிறது. இது ஆப்பிரிக்க மொழிகளில் பயிற்சி பெற்ற ஒரு சிறிய மொழி மாதிரி (small language model) ஆகும். லத்தீன் அமெரிக்காவில், ஒரு குழு LatAm GPT ஐ உருவாக்குகிறது. இது ஸ்பானிஷ், போர்த்துகீசியம் மற்றும் பூர்வீக பேச்சுவழக்குகளை அடிப்படையாகக் கொண்டது. இந்த திட்டங்கள் அனைத்தும் ஒரு வகையான கிளர்ச்சியாகும். அவை கண்ணுக்குத் தெரியாததை எதிர்த்துப் போராடுகின்றன. அவை, ஒரு அளவு பொருந்தக்கூடிய தொழில்நுட்பத்திற்கு எதிராகவும், தொழில்நுட்பம் ஒரு உச்சரிப்பை மட்டுமே பேசும் உலகக் கண்ணோட்டத்திற்கு எதிராகவும் உள்ளனர்.


இந்த மாற்றத்திற்கு என்ன காரணம்? பெங்களூரைச் சேர்ந்த தயாரிப்பு பயிற்சியாளரும், புத்தொழில் நிறுவனங்களுக்கான கூகிளின் (Google for Startups) வழிகாட்டியுமான ஸ்ரீநாத் வி விளக்குகிறார். தற்போதைய, பெரிய மொழி மாதிரிகள் (large language models) பல பகுதிகளின் மொழி, கலாச்சாரம் அல்லது குடிமை யதார்த்தங்களை முழுமையாக பிரதிநிதித்துவப்படுத்துவதில்லை என்று அவர் கூறுகிறார். கல்வி, சட்ட உதவி மற்றும் குடிமக்கள் ஆதரவு போன்ற பொது சேவைகளை வழங்க அரசாங்கங்கள் செயற்கை நுண்ணறிவைப் பயன்படுத்தத் தொடங்கும்போது, ​​உள்ளூர் மொழிகள், தரவு மற்றும் சமூக சூழல்களைப் புரிந்துகொள்ளும் மாதிரிகளின் தேவையை அவர்கள் காண்கிறார்கள். இந்தத் தேவையைப் பூர்த்தி செய்வதற்காக பிராந்திய பெரிய மொழி மாதிரிகள் (large language models (LLM)) உருவாக்கப்படுகின்றன.


சிங்கப்பூரை தளமாகக் கொண்ட ஆராய்ச்சி நிறுவனமான ட்விம்பிட்டின் நிறுவனர் மனோஜ் மேனன், ஸ்ரீநாத்துடன் அவர் உடன்படுகிறார். மேலும், அவர் குறிப்பிட்டதாவது, "AI உடன், கருத்தில் கொள்ள வேண்டிய பல முக்கியமான விவரங்கள் உள்ளன. அவற்றில் ஒன்று நமது உள்ளூர் மற்றும் தேசிய தேவைகளுக்கு ஏற்ப AI ஐ எவ்வாறு பயிற்றுவிப்பது என்பதுதான்."


இந்தப் பிரச்சினையின் மையத்தில் அரசியல் சார்ந்த ஒன்று உள்ளது. இது டிஜிட்டல் இறையாண்மை (digital sovereignty) என்று அழைக்கப்படுகிறது. ஸ்ரீநாத் இதை மேலும் குறிப்பிடுவதாவது, "தரவு இறையாண்மை இனி ஒரு யோசனை மட்டுமல்ல. அது இப்போது ஒரு உண்மையான கவலை. நாடுகள் தங்களால் கட்டுப்படுத்த முடியாத தரவுகளில் பயிற்சி பெற்ற AI மாதிரிகளை நம்பியிருக்க விரும்பவில்லை. உள்ளூர் மாதிரிகளை உருவாக்குவது அவர்களின் தரவுகளின் மீது கட்டுப்பாட்டை வைத்திருக்க உதவுகிறது."


இதெல்லாம் புவிசார் அரசியல் சக்திக்குக் கீழே வருகிறது. தங்கள் சொந்த AI மாதிரிகளை உருவாக்கும் நாடுகள் தங்கள் கலாச்சாரத்தை மட்டும் பாதுகாக்காது. அவை AI யுகத்தில் வர்த்தகம், இராஜதந்திரம் மற்றும் பாதுகாப்பு விதிகளையும் பாதிக்கும் என்று மேனன் கூறுகிறார், "இது ஒரு நியாயமான வாதம்" ஆகும். ஒரு தலைப்பை நாம் எவ்வாறு புரிந்துகொள்கிறோம் என்பது முற்றிலும் சூழலைப் பொறுத்தது என்று அவர் மேலும் கூறுகிறார். எனவே, புவிசார் அரசியல் ஒரு பெரிய நிலைமையை வகிக்கிறது. உள்ளூர் பிரச்சினைகள் மற்றும் சூழலைப் பயன்படுத்தி AI-ஐப் பயிற்றுவிக்கும் திறனும் முக்கியமானது.


இந்த வழியில் பார்க்கும்போது, ​​சிக்கனமான AI-ஐ நோக்கி நகர்வது பலர் நினைப்பதை விட முக்கியமானது. இந்த AI மாதிரிகளுக்கு பெரிய GPUகள் அல்லது மிக வேகமான இணையம் தேவையில்லை. அவை சிறியவை, விரைவானவை, மேலும் சூழலை நன்கு புரிந்துகொள்கின்றன. இதை விளக்க, ChatGPT ஆறு வழி நெடுஞ்சாலையில் ஒரு டெஸ்லாவைப் போல இருந்தால், BharatGPT என்பது கரடுமுரடான, குறுகிய சாலைகளுக்காக உருவாக்கப்பட்ட ஒரு மோட்டார் சைக்கிள் போன்றது. அது அழகாகத் தெரியாமல் இருக்கலாம். ஆனால், அது இன்னும் அதன் இலக்கை அடைய முடியும்.


பெரும்பாலான நாடுகள் தங்கள் சொந்த எல்லைகளுக்குள் AI எவ்வாறு பயன்படுத்தப்படுகிறது, கட்டுப்படுத்தப்படுகிறது மற்றும் பயன்படுத்தப்படுகிறது என்பதில் ஒரு பங்கை வகிக்க விரும்புவதாக ஸ்ரீநாத் கூறுகிறார். சுகாதாரம், சட்ட ஆலோசனை மற்றும் நலன்சார்ந்தவை போன்ற பொது சேவைகளுக்கான அணுகலை AI கட்டுப்படுத்தத் தொடங்கியுள்ளதால் இது முக்கியமானது. இந்த சூழ்நிலையில், ஒரு AI மாதிரி ஒரு குடிமகனின் மொழியைப் புரிந்து கொள்ளவில்லை என்றால், அது பயனற்றது மட்டுமல்ல, ஆபத்தானது கூட. இது தவறான தகவல்களைத் தரலாம், மக்களை விலக்கலாம் மற்றும் விழிப்புணர்வு எச்சரிக்கை இல்லாமல் தோல்வியடையலாம்.


ஆம், சிலிக்கான் பள்ளத்தாக்கு இன்னும் தலைப்புச் செய்திகளில் இடம்பிடிக்கிறது. ஆனால், சத்தத்திலிருந்து விலகி, ஆழமான ஒன்று நடக்கிறது. நுண்ணறிவை யார் வரையறுக்க வேண்டும் என்பதில் ஒரு மாற்றம் உள்ளது. AI-ன் மொழி யாரிடம் பேசுகிறது, யாருடைய பிம்பத்தில் AI கட்டமைக்கப்பட்டுள்ளது என்பதை இது மாற்றுகிறது. பிராந்திய AI "சிலிக்கான் பள்ளத்தாக்கில் கட்டமைக்கப்பட்டவற்றுடன் நேரடியாகப் போட்டியிடாது" என்று மேனன் கூறுகிறார். அதற்கு பதிலாக, அவர்கள் அதை பூர்த்தி செய்வார்கள். இது உள்ளூர் பகுதிகளில் AI மிகவும் பொருத்தமானதாக மாற உதவும்.


இந்த பிராந்திய AI முயற்சிகள் பாராட்டுதலைத் தேடுவதில்லை. அவர்கள் கட்டுப்பாட்டையும், செல்வாக்கையும் விரும்புகிறார்கள். அதேபோல், விரைவாக பெரிதாக வளர்வதில் கவனம் செலுத்துவதில்லை.



Original article:
Share: