Que signifie l’apprentissage par renforcement
L’apprentissage par renforcement, dans le contexte de l’apprentissage automatique et de l’intelligence artificielle (IA), est un type de programmation dynamique qui entraîne des algorithmes en utilisant un système de récompense et de punition.
Un algorithme d’apprentissage par renforcement, également appelé agent, apprend en interdisant avec son environnement. L’agent reçoit des récompenses pour des actions correctes et des pénalités pour des actions incorrectes. L’agent apprend sans intervention humaine en maximisant sa récompenses et en minimisant sa pénalité
Techopedia explique l’apprentissage par renforcement
L’apprentissage par renforcement est une approche de l’apprentissage automatique inspirée de la psychologie béhavioriste. Cela ressemble à la manière dont un enfant apprend à accomplir une nouvelle tâche. L’apprentissage par renforcement se distingue des autres approches d’apprentissage automatique au fait que l’algorithme n’est pas explicitement informé de la manière de réaliser une tâche, mais travaille sur le problème par lui-même.
En tant qu’agent, qui peut être une voiture autonome ou un programme jouant aux échecs. Il interagit avec son environnement, il reçoit un état de récompense en fonction de sa performance. Comme conduire en toute sécurité jusqu’à la destination ou remporter une partie. En revanche, l’agent reçoit une pénalité s’il se comporte de manière incorrecte. Comme sortir de la route ou être mis en échec.
Au fil du temps, l’agent prend des décisions pour maximiser sa récompense et minimiser sa pénalité en utilisant la programmation dynamique. L’avantage de cette approche en intelligence artificielle est qu’elle permet à un programme d’IA d’apprendre sans qu’un programmeur détaille comment un agent devrait effectuer la tâche.