கூகுளின் செயற்கை நுண்ணறிவு (googleAI) திட்டத்திற்கு ரெடிட் (Reddit) உரிம ஒப்பந்தம் (Reddit licensing deal) ஏன் முக்கியமானது? -ஜான் சேவியர், நபீல் அகமது

 சமூக ஊடக தளமான ரெட்டிட் (Reddit) வியாழக்கிழமை கூகிளுடன் உரிம ஒப்பந்தத்தை மேற்கொண்டது. இதன் மூலம் கூகுள் தனது செயற்கை நுண்ணறிவை (artificial intelligence (AI)) மேம்படுத்த ரெட்டிட் (Reddit)  பயனர்களின் பதிவுகளை பயன்படுத்த அனுமதிக்கிறது. இதற்காக கூகுள் ஒவ்வொரு ஆண்டும் Reddit நிறுவனத்திற்கு 60 கோடி  டாலர் செலுத்தும். இந்த ஒப்பந்தம் ரெட்டிட் மற்றும் கூகுள்  ஆகிய இரண்டிற்கும் சிறந்த வாய்ப்பாக உள்ளது. ரெட்டிட் அதன் வரவிருக்கும் ஆரம்ப பொது வழங்கலுக்கு (initial public offering (IPO)) முன் நிதி மற்றும் முதலீட்டாளர் ஆதரவை நாடுகிறது. அதே நேரத்தில், கூகிள் தனது செயற்கை நுண்ணறிவு முயற்சிகளில் பின்னடைவைத் தொடர்ந்து அதன் நற்பெயரை மீட்டெடுக்கும் நோக்கத்தை கொண்டுள்ளது. 


ரெடிட் (Reddit) பணம் சம்பாதிக்கிறது, ஆனால் இன்னும் லாபம் ஈட்டவில்லை. 2023ஆம் ஆண்டில் $804 கோடி சம்பாதித்ததாக அது பகிர்ந்து கொண்டது. அவற்றில் பெரும்பகுதி விளம்பரங்களிலிருந்து வந்தது. இருப்பினும், 90.8 கோடி டாலர் இழப்பும் ஏற்பட்டது. கூகுள் வழங்கும் பணம் ரெடிட் லாபகரமாக மாற முயற்சிக்க உதவும். மேலும், கூகுள் போன்ற பெரிய செயற்கை நுண்ணறிவு நிறுவனத்துடன் பணிபுரிவது ரெடிட் (Reddit)ஐ முதலீட்டாளர்களுக்கு மிகவும் கவர்ச்சிகரமானதாக மாற்றும். கலிபோர்னியாவின் மவுண்டன் வியூவை தளமாகக் கொண்ட கூகுள், அதன் செயற்கை நுண்ணறிவு சிக்கல்களை சரிசெய்ய உதவும் ரெடிட் (Reddit) லிருந்து மதிப்புமிக்க தரவைப் பெறுகிறது.


கூகுளுக்கு என்ன பாதிப்பு?


ரெடிட், OpenAI உடன் போட்டியிட முயற்சித்து வருகிறது, ஆனால் பல சவால்களை எதிர்கொண்டது. அதன் முதல் செயற்கை நுண்ணறிவு சாட்போட் (AI, chatbot) ’பார்ட்’ (Bard),   OpenAI ChatGPT உடன் போட்டியிட இருந்தது. இருப்பினும், பார்ட் (Bard)  அதன் முதல் டெமோ வீடியோவில் உண்மைப் பிழைகளைக் கொண்டிருந்தது மற்றும் அடுத்தடுத்த  சோதனைகளிலும் சிறப்பாக செயல்படவில்லை. 


சமீபத்தில், கூகுளின் ஜெமினி சாட்போட் (Gemini CHATBOT) பொருத்தமற்ற படங்களைக் காண்பிப்பதன் மூலம் தவறுகளைச் செய்தது. உதாரணமாக, அமெரிக்காவின் தந்தை யார் ?(‘Who is the United States’ founding father?’) என்று கேட்டபோது ஒரு கறுப்பினப் பெண்ணைக் காட்டியது. இது ஆசிய நபர்களை நாஜி கால ஜெர்மன் வீரர்களாகவும் சித்தரித்தது. இந்த தவறுகள் விமர்சனங்களுக்கு வழிவகுத்தன. மேலும், கூகுளின் தேடலுக்கான உயர் நிர்வாகி பிரபாகர் ராகவன்  மன்னிப்பு கேட்க வேண்டியிருந்தது.

கூகுளின் சிக்கல்கள் ஓரளவு அதன் மொழி மாதிரி (large language model (LLM)) எவ்வாறு இயங்குகின்றன மற்றும் அது பயன்படுத்தும் தரவு காரணமாகும். இந்த மாதிரிகளுக்கு துல்லியமான உரையை உருவாக்க நிறைய தரவு தேவை. இப்போது வரை, தொழில்நுட்ப நிறுவனங்கள் அனுமதியின்றி இணையத்திலிருந்து தரவை எடுத்துள்ளன. இந்த நடைமுறை பயனர்கள் மற்றும் வெளியீட்டாளர்களால் கேள்விக்குள்ளாக்கப்படுகிறது. 


ஜூலை 2023 இல், கூகுள் அதன் செயற்கை நுண்ணறிவைப் பயிற்றுவிக்க அனுமதியின்றி மக்களின் தனிப்பட்ட தகவல்களைப் பயன்படுத்தியதற்காக  வழக்குத் தொடரப்பட்டது. டிசம்பரில், தி நியூயார்க் டைம்ஸ்,  OpenAI மற்றும் மைக்ரோசாப்ட் மீது வழக்குத் தொடர்ந்தது. அனுமதியின்றி  ChatGPTக்கு பயிற்சி அளிக்க அதன் கட்டுரைகளைப் பயன்படுத்தியதாக வழக்கு கூறியது. இந்த நடவடிக்கைகள் சட்டமியற்றுபவர்களை வலை தகவல்களை நெறிமுறையாகப் பயன்படுத்துவதற்கான விதிகளைப் பற்றி சிந்திக்க வைக்கின்றன. 


அமெரிக்காவில் சட்டமியற்றுபவர்கள் செயற்கை நுண்ணறிவு அடித்தள மாதிரி வெளிப்படைத்தன்மை சட்டம் (AI Foundational Model Transparency Act) என்ற மசோதாவை அறிமுகப்படுத்தியுள்ளனர். இந்த மசோதா ஃபெடரல் டிரேட் கமிஷன் (Federal Trade Commission (FTC)) மற்றும் நேஷனல் இன்ஸ்டிடியூட் ஆஃப் ஸ்டாண்டர்ட்ஸ் அண்ட் டெக்னாலஜி (National Institute of Standards and Technology NIST)) ஆகியவற்றை விதிகளை உருவாக்குமாறு கேட்கிறது. இந்த விதிகள் செயற்கை நுண்ணறிவு நிறுவனங்கள் தங்கள் பயிற்சி தரவை எங்கிருந்து பெறுகின்றன என்பதை தெரிவிக்க வைக்கும். இந்த மசோதா சட்டமானால், செயற்கை நுண்ணறிவு நிறுவனங்கள் தரவைப் பயன்படுத்துவதற்கு பணம் செலுத்த வேண்டியிருக்கும். இது செயற்கை நுண்ணறிவு மாதிரிகளை உருவாக்குவதை அதிக செலவினம் கொண்டதாக மாற்றும்.


இந்த செலவுகளைத் தவிர்க்க, பெரிய தொழில்நுட்ப நிறுவனங்கள் செய்தி வெளியீட்டாளர்கள் மற்றும் பிற உள்ளடக்க வழங்குநர்களுடன் ஒப்பந்தங்களை மேற்கொள்கின்றன. உதாரணமாக, OpenAI, அசோசியேட்டட் பிரஸ் (Associated Press) உடன் ஒரு ஒப்பந்தம் செய்தது.  கேனட் மற்றும் நியூஸ் கார்ப் (Gannett and News Corp) போன்ற பிற செய்தி நிறுவனங்களும் OpenAI உடனான ஒப்பந்தங்களைப் பற்றி விவாதித்து வருகின்றன. இந்த நிறுவனங்கள் தங்கள் உள்ளடக்கத்தை திறந்த வெளி செயற்கை நுண்ணறிவு நிறுவனங்களால் எவ்வளவு பயன்படுத்துகின்றன என்பதன் அடிப்படையில் பணம் பெறும் என்று அறிக்கைகள் கூறுகின்றன.


இந்த ஒப்பந்தம் எவ்வளவு வித்தியாசமானது?


தொழில்நுட்ப நிறுவனங்கள் தரவை அணுகுவதற்கான சட்ட வழிகளைத் தேடும் நேரத்தில் ரெடிட் உடனான கூகுளின் ஒப்பந்தம் வருகிறது. ரெடிட் தனித்துவமானது, ஏனெனில் இது பயனர்கள் உள்ளடக்கத்தில் வாக்களிக்கும் சமூக செய்தி தளம். இது பயனர்கள் உள்ளடக்கத்தைப் பகிரும் சப்ரெடிட்கள் (SUB REDDIT) எனப்படும் பல துணை சமூகங்களைக் கொண்டுள்ளது. 


இந்த ஒப்பந்தத்தின் மூலம், கூகிள் ரெடிட்டின் Data API ஐ பயன்படுத்துவதற்கான அணுகலைப் பெறும். இது நிகழ்நேர உள்ளடக்கம் மற்றும் பயனர் நடத்தை மற்றும் போக்குகள் பற்றிய தகவலுக்கான அணுகலை கூகுளுக்கு வழங்குகிறது. கூகுள் இணையத்திலிருந்து தகவல்களைச் சேகரிக்க web crawler களை தொடர்ந்து பயன்படுத்தும்.


இருப்பினும், ஜூலை 2023 இல் ஒரு சிக்கல் இருந்தது. தரவு அணுகலுக்காக சில மூன்றாம் தரப்பு பயன்பாடுகளை வசூலிக்கும் கொள்கையை ரெடிட் அறிமுகப்படுத்தியது. இது உள்ளடக்க தணிக்கை மற்றும் அணுகல் பற்றிய கவலைகளுக்கு வழிவகுத்தது. 8,000க்கும் மேற்பட்ட சப்ரெடிட்கள் (SUB REDDIT) ஆஃப்லைனில் சென்று எதிர்ப்பு தெரிவித்தன. மாற்றங்கள் தளத்தின் தனிப்பயனாக்கத்திற்கு தீங்கு விளைவிக்கும் என்று அவர்கள் வாதிட்டனர். 


இந்த ஒப்பந்தத்தில் இதே போன்ற சிக்கல்களைத் தடுக்க, ரெடிட் அதன் சில சிறந்த பயனர்களுக்கு அதன் வரவிருக்கும் ஐபிஓவில் (IPO) பங்குகளை வாங்குவதற்கான வாய்ப்பை வழங்க திட்டமிட்டுள்ளது. இதில் மதிப்பீட்டாளர்கள் மற்றும் அதிக கர்மா மதிப்பெண்களைக் (karma score) கொண்ட பயனர்கள் உள்ளனர். இந்த திட்டத்தை தி வெர்ஜ் தெரிவித்துள்ளது.


ரெடிட்டின் (Reddit) திட்டம் பங்கு ஒதுக்கீட்டிற்கான அடுக்கு அடிப்படையிலான அமைப்பை உள்ளடக்கியது. அடுக்கு ஒன்றில் ரெடிட்டின் சமூக திட்டங்களுக்கு கணிசமாக பங்களித்த பயனர்கள் மற்றும் மதிப்பீட்டாளர்கள் உள்ளனர். இரண்டாவது அடுக்கில் குறைந்தது 2,000 மதிப்பெண் கொண்ட நபர்கள் மற்றும் குறைந்தது 5,000 மதிப்பீட்டாளர் செயல்களை முடித்தவர்கள் உள்ளனர். இந்த அணுகுமுறை பொதுவானதல்ல. பொதுவாக, ஒரு பரிமாற்றத்தில் பட்டியலிடப்படுவதற்கு முன்பு குறைந்த விலையில் பங்குகளை வாங்குவதற்கான வாய்ப்பு தொழில்முறை முதலீட்டாளர்களுக்கு வழங்கப்படுகிறது. ரெடிட் ஒவ்வொரு வாரமும் சுமார் 267.5 கோடி  செயல்பாட்டில் உள்ள பயனர்களைக் கொண்டுள்ளது. இது 100,000 க்கும் மேற்பட்ட செயல்பாட்டில் உள்ள சமூகங்களை வழங்குகிறது மற்றும் மொத்தம் ஒரு பில்லியன் இடுகைகளைக் கொண்டுள்ளது என SEC இல் தாக்கல் செய்ததில் கூறப்பட்டுள்ளது.


செயற்கை நுண்ணறிவு மாதிரிகளைப் பயிற்றுவிக்க பிற தளங்கள் பயனர் தரவைப் பயன்படுத்தியுள்ளதா?      


செயற்கை நுண்ணறிவு மாதிரிகளைப் பயிற்றுவிக்க பொது பயனர் தகவல்களைப் பயன்படுத்துவது குறித்து சில தளங்கள் திறந்துள்ளன. எடுத்துக்காட்டாக, எக்ஸ் முன்னர் ட்விட்டர் (X, formerly Twitter) அதன் கொள்கையின்படி,  செயற்கை நுண்ணறிவு பயிற்சிக்கு பயனர் இடுகைகளைப் பயன்படுத்துவதாக செப்டம்பரில் அறிவித்தது. இருப்பினும், குறிப்பிட்ட  செயற்கை நுண்ணறிவு மாடல் குறிப்பிடப்படவில்லை.


பேஸ்புக் (Facebook), இன்ஸ்டாகிராம் (Instagram) மற்றும் த்ரெட்ஸ் (Threads) போன்ற அதன் பயன்பாடுகளின் தரவு அதன் சாட்போட்டுக்கு  செயற்கை நுண்ணறிவுக்கு பயிற்சி அளிக்கும் என்று மெட்டா (metta) கூறியுள்ளது. ஸ்னாப்சாட்  மற்றும் டிக்டாக் (TikTok and Snapchat) ஆகியவை  செயற்கை நுண்ணறிவு சாட்போட்களை (AI chatbot) அறிமுகப்படுத்தியிருந்தாலும், பயனர் இடுகைகள் பயிற்சிக்கு பயன்படுத்தப்படுகின்றனவா என்று அவர்கள் கூறவில்லை.


வீடியோக்கள், கட்டுரைகள் மற்றும் திரைப்படங்களுக்கான பரிந்துரை இயந்திரங்கள் போன்ற வழிமுறைகளைப் பயிற்றுவிக்க தொழில்நுட்பத்தில் பயனர் தரவைப் பயன்படுத்துவது பொதுவானது. ஆனால்,  செயற்கை நுண்ணறிவு மாதிரிகளைப் பயிற்றுவிக்க இந்தத் தரவைப் பயன்படுத்துவது ஒரு புதிய நடைமுறையாகும். இது கவலைகளை எழுப்புகிறது, குறிப்பாக சாட்போட்கள் (chatbot) தற்செயலாக தங்கள் பதில்களில் தனிப்பட்ட தகவல்களை வெளிப்படுத்த முடியும் என்பதால். இந்த ஆபத்துக்கு ஒரு எடுத்துக்காட்டு சாம்சங் அதன் அலுவலகங்களில்  செயற்கை நுண்ணறிவு சாட்போட்களை (AI chatbot) தடை செய்தது, ஏனெனில் ஊழியர்கள் அதனுடன் தொடர்பு கொண்ட பிறகு ஒரு போட் (bot) நிறுவனத்தின் ரகசியங்களை வெளிப்படுத்தியது.


கூகுள் மற்றும் ரெடிட் இடையேயான ஒப்பந்தம் இரு தரப்பினருக்கும் சரியான நேரத்தில் உள்ளது. ரெடிட் அதன் ஐபிஓவுக்கு ( initial public offering (IPO)) முன் நிதி ஆதரவு மற்றும் முதலீட்டாளர் ஆர்வத்தை நாடுகிறது. கூகுள் அதன்  செயற்கை நுண்ணறிவு (googleAI) திட்டங்களில் உள்ள சிக்கல்களைத் தொடர்ந்து அதன் நற்பெயரை மேம்படுத்துவதை நோக்கமாகக் கொண்டுள்ளது.




Original article:

Share: