கணனிக் கணிப்புக்குக் கொத்தடிமையாலாகாது
இன்று கணனித் துறையில் கற்சிலைக்கும் கற்பூர வாசனையறியாத கழுதைக்கும் கதர் வேட்டி கட்டியது போல ஏந்திரக் கற்றல் (அனுமானிப்புக் கற்றல்) Machine Learning எனப்படும் பல்லாண்டு கால அனுமானிப்பு புதிய பொலிவைப் பெற்றுள்ளது. சேவை வர்த்தகத்தில் புதிய மென்பொருள் உருவாக்குதலிலும், புதிய வர்த்தக, சூழல் புதிர்களை புதிய – புதிய அறிவியல் சிந்தனைகள், கண்டுபிடிப்புக்கள் மூலம் தீர்க்காமல் வழித் தேங்காயை எடுத்து தெருச்சாமிக்கு அடிக்கும் பலரையே வர்த்தகக் கணனித் துறையில் காணக்கூடியக் கூடியதாகவுள்ளது.
ஆடம்பர உடை உடுத்தலில் ஒவ்வொரு பருவகாலத்திற்கும் ஏற்றாப்போல பழைய மற்றும் புதிய நிறங்களுடன், ஆடை அணிகள் திடீரென அதிக முக்கியத்துவம் பெறுவது போல, இன்று வர்த்தக ஊடகங்களும், குறுகிய கால வாங்கி – விற்கும் வர்த்தக முதலீட்டு கடன் தாபனங்களும் போட்டி போட்டு ஏந்திரக் கற்றல் எனும் ஒரு வகை கணனி வழி முறைமையை பிரபலயப் படுத்துகின்றன.
புதிய பெருந்தரவு தகவல் கணனி முலம் சேகரி்த்துப் பரிமாறும் வலிமை தற்போது காணப்படினும், சரித்திர ரீதியில் பார்க்கும் போது ஏந்திரக் கற்றல் எனும் கணனி முறை ஏறத்தாழ சுமார் அறுபது வருடங்களிற்கு மேற்பட்ட கணனியல் கைமுறை. இது கணிதத்தையும், புள்ளிவிபரத்தையும், மொழியிலையும் சேர்த்துக் கையாளும் தொழிநுட்ப அறிவியல். இன்று இதை தூசி தட்டிக் காசு உழைக்க விளைகின்றனர் சிலர். இதற்கான ஒரு பின்னணிக் காரணம் சென்ற இருபத்தைந்தாண்டுகள் கணனித் தொழிநுட்ப சேவை வருமானம் குறைந்து கொண்டே போகிறது. இதை வைத்து பெரும் ஆதாயம் பெறும் காலம் போய் விட்டது. எனவே சுடச் சுடத் தோசைத் தட்டில் தோசைக்குப் பின் வினோத புதிய பரோட்டா போட்டு சம்பாதிக்க இது புதிய வியாபார தந்திரமார இருக்குமோ என்னவோ என்று யாவரும் முனைந்து பார்க்கின்றனர்.
நுகர்வோர் ஆகிய நாம் இன்று வட அமெரிக்காவில் இணையம் ஊடு சினிமாப் படம் நெற் ஃபிளிக்ஸ் (Netflix) பார்த்தால் என்ன, இல்லை புத்தகம், பொருள் பண்டங்களை பாரிய இணையக் கடையான அமெசானில் (Amazon) பெற்றால் என்ன, எமது முந்திய கொள்வனவு முறைகளை அவதானித்து எமக்குப் பிடித்த புதிய பண்டங்களை எம்மை வாங்க உந்தவைப்பது மேற்குறிப்பிடப்படும் கணனி முறையே.
செயற்கை நரம்பியல் மின் வலைகள் (Neural Networks), பின்பற்று வழிமுறை (back propagation), பயேசியன் இணையங்கள் (Bayesian networks), பிரிவியல் வழிமுறைகள் (classifiers) போன்ற யாவும் கணனி அனுமானிப்பு வழிமுறைகள் ஆகும். இவை தொழிநுட்ப ஆர்வலர்கள் (Geeks) தவித்த சாதாரண மக்களைப் பொறுத்தளவில் ஏதோ பாவனையற்ற சொற்களே. அதே சமயம் புதிய யுக்தி, வருமான சந்தர்ப்பம் எங்கு உண்டோ அங்கு புகுந்து இரண்டு துட்டு சம்பாதிக்க நினைப்பவர்கள்; நுகர்வோர் – சாதாரண மக்களை நீங்கள் இதை பொருட்படுத்தாதீர் நீங்கள் உங்கள் வழியில் போய்க் கொள்ளுங்கள் என்கின்றனர்.
அது சரி எந்திரக் கற்றல் (machine learning) என்றால் என்ன? இது கணனி எந்திரமானது பாரிய தரவு தகவல் உள்ளெடுத்து, தரவில் ஒரு பாகத்தை தனது அனுமானிப்புக் கணிப்புக்களுக்கு உபயோகித்து, மீதி தகவல்களில் இருந்து உபயோகமுள்ள கணிப்பு முடிவுகளைப் பெற்றுத் தருதலே.
அனுமானிப்புக் கணிப்புக்குப் பாவிக்கப்படும் தகவல் பாகம், பயிற்சிக் கணிப்புக் குவியல் (training set) எனப்படும். இதை வைத்து புதிதாக வரும் எற்கனவே தெரிந்திராத தகவல்களை கணனி பல்விதமான கணித தொடர்பு – புள்ளிவிபரவியல்கள் மூலம் புதிய தீர்வுகளைத் தரவைக்கும் வழிமுறையே ஏற்திரக் கற்றல் எனப்படும். இதற்கு நாம் தற்போதய நடைமுறை உதாரணத்தை எடுத்துப் பார்க்கலாம். ஏற்கனவே புகுத்தப்பட்ட தரவு தகவல்களைக் கொண்டு வெவ்வேறு தாபனங்களுக்குச் சாதகமான வர்த்தக முடிவுகளை எடுக்க உதவும்.
வங்கியில் கடன் விண்ணப்பங்களில் இருந்து தரவு தகவல் அனுமானிப்பைக் கொண்டு வருங்காலத்தில் நிர்ணயமாகக் கடன் செலுத் தக் கூடியவர்களைத் தேர்த்தெடுத்தல், ஆனால் இந்தத் தீர்வுகள் அனுபவமுள்ள மனித ஆய்வலர்களைத் தவிர்த்து எவ்வாறு கணனி சார்ந்த தீர்மானங்கள் எடுக்கப்படுகின்றன என்று சாதாரண மக்களுக்கு விளக்கம் தெரிவிக்கப்படுவதில்லை. இதைப் போன்று பல்வேறு அண்மைக்கால வங்கி, காப்புறுதி, மருத்துவக்காப்புறுதி, பயங்கரவாதத் தடுப்பு, பணப்பரிமாற்ற மோசடிப் புலனாய்வு நடவடிக்கைகளிலும் பாவிக்கப்படுகின்றன.
பெருந் தகவல் நூற்றாண்டில் கணனிகள் பெருமளவு தகவல்களை உட்கொள்ளும் தகுதி வாய்ந்தவை. ஆனால் ஒரு வகையில் இது முறுக்கு, இடியப்பம் புழியும் உபகரணம் போன்றதே. அதாவது உருவகத்தில் முறுக்கு, இடியப்பம் வெவ்வேறு துளைகள் உள்ள அச்சுக்களை வைத்து ஒரே உரலில் ஆக்கிக் கொள்ள முடியும். ஆனால் தரமான முறுக்கு, இடியப்பம் குழைக்கும் மாவும், அதன் உள் சேர்க்கப்படும், சுவை, வாசனைத் திரவியங்களை பொறுத்தே அமையும்,
இதைப் போன்றதே எந்திரக் கற்றல் கணனி அனுமானிப்பு வழிமுறையும், வெறும் யார் யாரினாலோ ஏற்கனவே ஆக்கப்பட்ட மென்பொருள் இடியப்ப உரல் இருப்பதால், உள்ள எல்லாத் தொகை தொகையான தரவு மாக்குழையலைப் போட்டால் மற்றப் பக்கம் சரியான சுவையான தரமான பண்டம் வரும் என்றில்லை.
சேர்க்கப்படும் தரவு தகவல்கள் மாசு அற்றவையா என்ற ஆழ்ந்த அறிவும், அடுத்து வெளிவரும் தீர்மானங்கள் குறிப்பிட்ட வர்த்தகமோ, மற்றைய தேவைக்கு தகுந்த பதில்களை, எதுவித பாரபட்சம் இன்றித் தொடர்ந்தும் தருகின்றனவா என்றும் அறிதல் அவசியம். இல்லையேல் கணனி அனுமானிப்புக்கள் வர்த்தக பங்குச் சந்தையில் பலவித சாதக பாதகங்களை சாதாரண மக்களின் அன்றாட வாழ்விலும் உண்டு பண்ணலாம்.
எனவே தரவு தகவல்கள் கணித எண்களாகவோ, இல்லை மொழிச் சொற்களாகவோ இருக்கலாம். இலத்திரனில் நிழற்படம், ஓடு படமாகவும் இருக்கலாம். ஆனால் அவற்றில் இருந்து கருத்துப் பிரித்து அனுமானித்து வாழ்க்கைத் தீர்மானங்களை எடுப்பது இலகுவான விடயம் அல்ல. குறிப்பாக மனிதத்துவத்தை தவிர்த்து ஏந்திர முடிவுகளே இனி நிரந்தர முடிவுகள் என்ற குறுகிய சோம்பலான கொள்கை தற்காலத்தையும், எதிர்காலத்தையும் எமக்கு மாற்றியமைக்கலாம்.
எனவே விரைந்து வரும் தொழினுட்பத்தை அனுசரித்து ஓரிரு துண்டு பணம் சம்பாதிக்கலாம் என்ற ஆசையினால் , நாம் தான்தோன்றித்தனமான கணனிக் கணிப்பியலுக்குக் கொத்தடிமை ஆகாது நிதானமாகக் சிந்தித்துச் செயற்படுதல் எமது சமூகத்தின் மேம்பாட்டிற்கு நல்ல விடயமே.
- யோகி –