ChatGPT-யை சிறந்ததாகவும் அனைவருக்கும் இலவசமாகவும் மாற்றும் OpenAI -ன் புதிய செயற்கை நுண்ணறிவு மாதிரி GPT-4o -பிஜின் ஜோஸ்

 இலவச பயனர்களுக்கு GPT-4o என்பது ஒரு சிறந்த வாய்ப்பாக உள்ளது. ஏனெனில் அவர்கள் இப்போது GPT-4-நிலை நுண்ணறிவை மிக விரைவான மற்றும் திறமையான ChatGPT -ல் பெறுவார்கள்.


மே 13 திங்கட்கிழமை அன்று, OpenAI ஆனது GPT-4o என்ற புதிய பெரிய மொழி மாதிரியை (large language model (LLM)) அறிமுகப்படுத்தியது. இது அவர்களின் வேகமான மற்றும் சக்திவாய்ந்த AI மாதிரியை அறிமுகப்படுத்துகிறது. இது ChatGPT ஐ மேம்படுத்தி, அதை சிறந்ததாகவும், எளிமையாகவும் மாற்றும் என்று அவர்கள் கூறுகிறார்கள். 


இதற்கு முன், OpenAI-லிருந்து மிகவும் மேம்பட்ட பெரிய மொழி மாதிரி (large language model (LLM)) GPT-4 ஆகும். இது பணம் செலுத்தும் பயனர்களுக்கு மட்டுமே கிடைத்தது. ஆனால், இப்போது, GPT-4o அனைவரும் பயன்படுத்த இலவசமாகக் கிடைக்கும்.


GPT-4o என்றால் என்ன?


GPT-4o, இதில் "o" என்பது "ஆம்னி" (“o” stands for “Omni”) என்பதைக் குறிக்கிறது. இது ஒரு அற்புதமான செயற்கை நுண்ணறிவு (AI) மாதிரியாகக் காணப்படுகிறது. மனிதர்கள் கணினிகளுடன் எவ்வாறு தொடர்பு கொள்கிறார்கள் என்பதை மேம்படுத்த இது வடிவமைக்கப்பட்டுள்ளது. இது, பயனர்கள் உரை, காணொலி அல்லது படங்களை உள்ளிடலாம் மற்றும் அதே வடிவங்களில் பதில்களைப் பெறலாம். இது GPT-4o-ஐ பல்திறன் செயற்கை நுண்ணறிவு (AI) மாதிரியாக மாற்றுகிறது. இது பழைய மாதிரிகளிலிருந்து ஒரு பெரிய மாற்றமாகத் தெரிகிறது.


OpenAI இன் தலைமை தொழில்நுட்ப அதிகாரி, மீரா முராட்டி, புதிய மாதிரி  பயன்பாட்டிற்கு எளிதாக வரும்போது OpenAI ஒரு பெரிய படியை முன்னோக்கி வைப்பது இதுவே முதல் முறை என்று கூறினார்.


GPT-4o, நேரடி செய்முறைகளின் அடிப்படையில், ChatGPT பல பணிகளைச் செய்யக்கூடிய மின்னணு உதவியாளராக மாறியது போல் தெரிகிறது. இதில் நிகழ்நேரத்தில் மொழிபெயர்க்கலாம் (real-time translations), பயனரின் முகங்களைப் படிக்கலாம் (reading a user’s face) மற்றும் நிகழ்நேர பேச்சு உரையாடல்களின் மூலம் பேசலாம் (real-time spoken conversations). இது, இதைப்போன்ற மற்ற ஒத்த மாதிரிகளை விட மேம்பட்டது.


GPT-4o உரை மற்றும் படங்களைப் பயன்படுத்தி கலந்துரையாட முடியும், எனவே, பயனர்கள் பதிவேற்றும் ஸ்கிரீன் ஷாட்கள் (screenshots), புகைப்படங்கள்  (photos), ஆவணங்கள் (documents) அல்லது விளக்கப்படங்களைப் (charts) பார்க்கவும் விவாதிக்கவும் முடியும். புதிய ChatGPT ஆனது கடந்த கால உரையாடல்களை நினைவில் வைத்து அவற்றிலிருந்து கற்றுக்கொள்ளும் என்று OpenAI குறிப்பிட்டுள்ளது.


GPT-4o க்குப் பின்னால் உள்ள தொழில்நுட்பம் என்ன?


செயற்கை நுண்ணறிவு சாட்போட்களுக்கு (AI chatbots) பெரிய மொழி மாதிரி (large language model (LLM)) இன்றியமையாதவை. இந்த மாதிரிகளில் பெரிய அளவிலான தரவுகள் கொடுக்கப்பட்டு, தானாகவே விஷயங்களைக் கற்கும் திறனை உருவாக்குகிறார்கள்.


GPT-4o என்பது முந்தைய மாதிரிகளிலிருந்து முற்றிலும் வேறுபட்டது. முன்பு, வெவ்வேறு பணிகளைக் கையாள பல மாதிரிகள் தேவைப்பட்டன. ஆனால் இப்போது, GPT-4o ஆனது, உரை, படங்கள் மற்றும் ஒலி போன்ற அனைத்தையும் ஒரே மாதிரியில் செய்கிறது. ஆனால் GPT-4o மூலம், இந்த பணிகள் அனைத்தையும் அது தானே செய்ய முடியும். பழைய மாதிரிகளுக்கு குரல் பயன்முறைக்கு மூன்று வெவ்வேறு மாதிரிகள் தேவை என்று முராட்டி விளக்கினார். ஆனால், GPT-4o-ல்  அனைத்தையும் ஒன்றாகச் செய்கிறது.


இதன் பொருள் GPT-4o பல்வேறு வகையான தகவல்களை ஒன்றாகப் புரிந்துகொள்வதில் சிறந்தது. உதாரணமாக, இது தொனி (tone), பின்னணி இரைச்சல் (background noises) மற்றும் ஒலிப்பதிவில் உள்ள உணர்ச்சிகளை (emotional context in audio) ஒரே நேரத்தில் புரிந்து கொள்ள முடியும். ஆனால், இந்த திறன்கள் முந்தைய மாதிரிகளுக்கு ஒரு பெரிய சவாலாக இருந்தது.


அம்சங்கள் மற்றும் திறன்கள் என்று வரும்போது, GPT-4o வேகம் மற்றும் செயல்திறன் போன்ற துறைகளில் சிறந்து விளங்குகிறது. ஏனெனில், இது ஒரு நபர் உரையாடலில் 232 முதல் 320 மில்லி வினாடிகளில் கேள்விகளுக்கு விரைவாக பதிலளிக்கிறது. இந்த புதிய மாதிரி ஒரு பெரிய முன்னேற்றம் ஆகும். இதற்கு முன், பழமையான மாதிரிகள் பதிலளிக்க பல வினாடிகள் எடுத்தன.


GPT-4o பல மொழிகளை ஆதரிக்கிறது மற்றும் ஆங்கிலம் தவிர வேறு மொழிகளில் உள்ள உரையைப் புரிந்துகொள்வதில் சிறந்ததாக உள்ளது. இது உலகளாவிய பார்வையாளர்களுக்கு அணுகக்கூடியதாக அமைகிறது.


GPT-4o ஒலி மற்றும் காணொலிகளைப் புரிந்துகொள்வதிலும் இது மேம்பட்டுள்ளது. நேரடி செய்முறைகளில், ChatGPT ஒரு கணிதச் சிக்கலை பயனர் எழுதியது போல் தீர்த்தது. இது ஒளிப்பதிவுக் கருவியில் ஒருவரின் உணர்ச்சிகளைச் சொல்லவும் பொருள்களை அடையாளம் காணவும் முடியும்.


அது ஏன் முக்கியம்?


மெட்டா மற்றும் கூகிள் போன்ற பெரிய நிறுவனங்கள் இன்னும் சிறந்த பெரிய மொழி மாதிரிகளை (large language model (LLM)) உருவாக்கி அவற்றை வெவ்வேறுத் தயாரிப்புகளில் பயன்படுத்தும் நேரத்தில் இது நிகழ்கிறது. GPT-4o ஆனது, OpenAI-ல் பில்லியன்களை முதலீடு செய்துள்ள மைக்ரோசாப்ட் நிறுவனத்திற்கு பயனுள்ளதாக இருக்கும். ஏனெனில், அது தற்போதுள்ள சேவைகளில் இந்த மாதிரியை பயனுள்ளதாக மாற்ற முடியும்.


இந்த புதிய மாதிரி, கூகுளின் டெவலப்பர் மாநாட்டிற்கு (Google I/O developer conference) முன்னதாக வெளிவருகிறது. அங்கு, அவர்கள் தங்கள் புதிய ஜெமினி செயற்கை நுண்ணறிவு மாதிரியைப் (Gemini AI model) பற்றி பேசலாம். GPT-4o-ஐப் போலவே, ஜெமினியும் பல்வேறு வகையான தகவல்களைக் கையாளும் என்று எதிர்பார்க்கப்படுகிறது. மேலும், ஜூன் மாதம், ஆப்பிள் உலகளாவிய மென்பொருள் உருவாக்குவோர் மாநாட்டின்போது (Apple Worldwide Developers Conference), அவர்கள் ஐபோன்கள் அல்லது iOS புதுப்பிப்புகளில் செயற்கை நுண்ணறிவை எவ்வாறு பயன்படுத்துகிறார்கள் என்பதை அறிவிப்பார்கள்.


GPT-4o எப்போது கிடைக்கும்?


GPT-4o படிப்படியாக பொதுமக்களுக்கு வெளியிடப்படும். இப்போது, நீங்கள் ஏற்கனவே ChatGPT-ல் உரை (Text) மற்றும் பட அம்சங்களை (image capabilities) இலவசமாகப் பயன்படுத்தலாம். மென்பொருள் உருவாக்குவோர் மற்றும் குறிப்பிட்ட பங்குதாரர்களுக்கு ஒலி (Audio) மற்றும் ஒளி (Video) அம்சங்கள் மெதுவாக சேர்க்கப்படும். ஒவ்வொரு முறையும் குரல், எழுத்தில் இருந்து பேச்சு, காட்சி (voice, text-to-speech, vision) முழு வெளியீட்டிற்கு முன் தேவையான பாதுகாப்புத் தரங்களைப் பூர்த்தி செய்வதை உறுதி செய்கிறது.


GPT-4o -ன் வரம்புகள் மற்றும் பாதுகாப்புக் கவலைகள் என்ன?


GPT-4o மிகவும் மேம்பட்டதாகக் கருதப்பட்டாலும், அதற்கு இன்னும் சில வரம்புகள் உள்ளன. OpenAI-ன் வலைப்பதிவு GPT-4o ஒருங்கிணைக்கப்பட்ட பலவகை தொடர்புகளை ஆராய்வதற்கான அதன் பயணத்தில் இன்னும் ஆரம்ப கட்டத்திலேயே உள்ளது என்று குறிப்பிட்டுள்ளது. இதன் பொருள் ஒலி வெளியீடுகள் போன்ற அம்சங்கள் இப்போதைக்கு முன்னமைக்கப்பட்ட குரல்களுடன் ஆரம்பத்தில் வரையறுக்கப்பட்ட வடிவத்தில் கிடைக்கின்றன.


பாதுகாப்பைப் பொறுத்தவரை, OpenAI GPT-4o-ல் கட்டமைக்கப்பட்ட பாதுகாப்பு அம்சங்களைக் கொண்டுள்ளது. அதாவது கவனமாகத் தேர்ந்தெடுக்கப்பட்ட பயிற்சித் தரவு மற்றும் பயிற்சிக்குப் பிறகு அதன் செயல்பாட்டில் செய்யப்பட்ட மாற்றங்கள் போன்றவை ஆகும். சைபர் பாதுகாப்புகள் (cybersecurity), தவறான தகவல்களைப் பரப்புதல் (misinformation) மற்றும் சார்பு (bias) போன்ற அபாயங்களைப் பார்ப்பது உள்ளிட்ட பாதுகாப்பிற்காக, மாதிரியை முழுமையாக சோதித்ததாக அவர்கள் கூறினர்.


இப்போதைக்கு, GPT-4o பல்வேறு பகுதிகளில் நடுத்தர அளவிலான ஆபத்தைக் கொண்டுள்ளது. வரக்கூடிய புதிய அபாயங்களைக் கண்டறிந்து குறைக்க OpenAI தொடர்ந்து செயல்பட்டு வருகிறது.




Original article:

Share: