பொருளடக்கம்:
வரையறை - வலுவூட்டல் கற்றல் என்றால் என்ன?
செயற்கை நுண்ணறிவின் பின்னணியில் வலுவூட்டல் கற்றல் என்பது ஒரு வகை டைனமிக் புரோகிராமிங் ஆகும், இது வெகுமதி மற்றும் தண்டனை முறையைப் பயன்படுத்தி வழிமுறைகளுக்கு பயிற்சி அளிக்கிறது.
ஒரு வலுவூட்டல் கற்றல் வழிமுறை அல்லது முகவர், அதன் சூழலுடன் தொடர்புகொள்வதன் மூலம் கற்றுக்கொள்கிறது. முகவர் சரியாக செயல்படுவதன் மூலம் வெகுமதிகளையும், தவறாக செயல்படுவதற்கான அபராதங்களையும் பெறுகிறார். முகவர் ஒரு மனிதனின் தலையீடு இல்லாமல் அதன் வெகுமதியை அதிகரிப்பதன் மூலமும் அதன் தண்டனையை குறைப்பதன் மூலமும் கற்றுக்கொள்கிறார்.
டெகோபீடியா வலுவூட்டல் கற்றலை விளக்குகிறது
வலுவூட்டல் கற்றல் என்பது நடத்தை கற்றலின் ஒரு அணுகுமுறையாகும், இது நடத்தை உளவியலால் ஈர்க்கப்படுகிறது. ஒரு குழந்தை ஒரு புதிய பணியை எவ்வாறு செய்ய கற்றுக்கொள்கிறது என்பதைப் போன்றது. வலுவூட்டல் கற்றல் மற்ற இயந்திர கற்றல் அணுகுமுறைகளுடன் முரண்படுகிறது, அதில் ஒரு பணியை எவ்வாறு செய்வது என்று வழிமுறை வெளிப்படையாகக் கூறப்படவில்லை, ஆனால் சிக்கலைத் தானாகவே செயல்படுத்துகிறது.
ஒரு முகவராக, சுய-ஓட்டுநர் கார் அல்லது சதுரங்கம் விளையாடும் ஒரு நிரலாக இருக்கலாம், அதன் சூழலுடன் தொடர்புகொள்கிறது, அது எவ்வாறு செயல்படுகிறது என்பதைப் பொறுத்து வெகுமதி நிலையைப் பெறுகிறது, அதாவது இலக்குக்கு பாதுகாப்பாக வாகனம் ஓட்டுதல் அல்லது ஒரு விளையாட்டை வெல்வது போன்றவை. இதற்கு நேர்மாறாக, சாலையில் இருந்து வெளியேறுவது அல்லது சோதனைக்கு உட்படுத்தப்படுவது போன்ற தவறாக செயல்படுவதற்கு முகவர் அபராதம் பெறுகிறார்.
காலப்போக்கில் முகவர் அதன் வெகுமதியை அதிகரிக்கவும், டைனமிக் நிரலாக்கத்தைப் பயன்படுத்தி அதன் தண்டனையை குறைக்கவும் முடிவுகளை எடுக்கிறார். செயற்கை நுண்ணறிவுக்கான இந்த அணுகுமுறையின் நன்மை என்னவென்றால், ஒரு முகவர் எவ்வாறு பணியைச் செய்ய வேண்டும் என்பதை ஒரு புரோகிராமர் இல்லாமல் ஒரு AI நிரலைக் கற்றுக்கொள்ள அனுமதிக்கிறது.
