Conditionnement instrumental en psychologie

Contents

Le conditionnement instrumental est un autre terme pour le conditionnement opérant, un processus d’apprentissage décrit pour la première fois par B. F. Skinner. Dans le conditionnement instrumental, le renforcement ou la punition sont utilisés pour augmenter ou diminuer la probabilité qu’un comportement se reproduise dans le futur.

Exemples de conditionnement des opérateurs

Par exemple, si un élève est récompensé par des éloges chaque fois qu’il lève la main en classe, il est plus probable qu’il lèvera à nouveau la main à l’avenir.

Si elle est également grondée lorsqu’elle parle hors de son tour, elle a moins de chances d’interrompre le cours. Dans ces exemples, l’enseignant utilise le renforcement pour renforcer le comportement de lever la main et la punition pour affaiblir le comportement de parler hors de son tour.

Le conditionnement instrumental est souvent utilisé dans le dressage des animaux également. Par exemple, entraîner un chien à serrer la main impliquerait d’offrir une récompense chaque fois que le comportement souhaité se produit.

Historique du conditionnement des opérateurs

Le psychologue E.L. Thorndike a été l’un des premiers à observer l’impact du renforcement dans le cadre d’expériences de boîtes à puzzle avec des chats. Au cours de ces expériences, Thorndike a observé un processus d’apprentissage qu’il a appelé l’apprentissage par « essais et erreurs ».

Les expériences consistaient à placer un chat affamé dans une boîte à puzzle, et pour se libérer, le chat devait trouver un moyen de s’échapper. Thorndike a ensuite noté le temps qu’il fallait aux chats pour se libérer dans chaque essai expérimental. Au début, les chats ont utilisé des méthodes d’évasion inefficaces, grattant et creusant sur les côtés ou le dessus de la boîte. Finalement, des essais et des erreurs ont conduit les chats à pousser ou à tirer avec succès la voie d’évacuation. Après chaque essai successif, les chats se sont de moins en moins livrés à des comportements de fuite inefficaces et ont réagi plus rapidement en prenant les mesures d’évasion appropriées.

A lire :  Théorie de la réduction de la conduite et comportement humain

Thorndike a appelé ses observations « loi d’effet ». La force d’une réponse augmente lorsqu’elle est immédiatement suivie d’un « satisfaisant » (renforçateur). En revanche, les actions qui sont suivies d’effets désagréables sont plus susceptibles d’être affaiblies.

Dans les expériences de Thorndike sur la boîte à puzzle, le fait de s’échapper de la boîte était la satisfaction. Chaque fois que les chats réussissaient à s’échapper de la boîte, le comportement qui précédait immédiatement l’évasion était renforcé.

Le travail de Thorndike a eu un effet considérable sur les recherches ultérieures de B.F. Skinner sur le conditionnement opératoire. Skinner a même créé sa propre version des boîtes à puzzle de Thorndike, qu’il a appelé une chambre opérante, également connue sous le nom de boîte de Skinner.

Comment fonctionne le conditionnement des opérateurs

Skinner a identifié deux types de comportements clés. Le premier type est celui des comportements des répondants. Il s’agit simplement d’actions qui se produisent de manière réflexive sans aucun apprentissage. Si vous touchez quelque chose de chaud, vous retirez immédiatement votre main en réponse. Le conditionnement classique se concentre sur ces comportements des répondants.

Dans les expériences classiques de Pavlov avec les chiens, le comportement des répondants consistait à saliver à la présentation de la nourriture. En établissant une association entre le son d’un buzzer et la présentation de la nourriture, Pavlov a cependant réussi à entraîner les chiens à saliver simplement au son de ce buzzer.

Skinner a réalisé que si le conditionnement classique pouvait expliquer comment les comportements des répondants pouvaient conduire à l’apprentissage, il ne pouvait pas rendre compte de chaque type d’apprentissage. Il a plutôt suggéré que ce sont les conséquences des actions volontaires qui conduisent au plus grand nombre d’apprentissages.

A lire :  Stimulation non conditionnée dans le conditionnement classique

Le deuxième type de comportements est ce que Skinner appelle les comportements opérants. Il les définit comme tout comportement volontaire qui agit sur l’environnement pour créer une réponse. Ce sont les comportements volontaires qui sont sous notre contrôle conscient. Ce sont également des actions qui peuvent être apprises. Les conséquences de nos actions jouent un rôle important dans le processus d’apprentissage.

Renforcement et sanctions

Skinner a identifié deux aspects clés du processus de conditionnement des opérateurs. Le renforcement sert à augmenter le comportement, tandis que la punition sert à le diminuer. Il existe également deux types différents de renforcement et deux types différents de punition.

Le renforcement positif consiste à présenter un résultat favorable, comme par exemple donner une friandise à un enfant après qu’il ait nettoyé sa chambre.

Le renforcement négatif consiste à supprimer un stimulus désagréable, comme de dire à un enfant que s’il mange toutes ses pommes de terre, il n’aura pas à manger ses brocolis. Comme l’enfant considère que manger des brocolis est désagréable et que manger des pommes de terre entraîne la suppression de cette tâche indésirable, manger des pommes de terre est alors un renforcement négatif.

La punition positive consiste à appliquer un événement désagréable après un comportement. La fessée, par exemple, est un exemple courant de punition positive. Ce type de punition est souvent appelé « punition par application ». Une conséquence négative est directement appliquée pour réduire le comportement indésirable.

La punition négative consiste à retirer quelque chose d’agréable après qu’un comportement se soit produit. Par exemple, si un enfant ne parvient pas à nettoyer sa chambre, ses parents peuvent lui dire qu’il ne peut pas aller au centre commercial avec ses amis. Le fait de lui enlever l’activité désirable agit comme une punition négative sur le comportement précédent.

Bouton retour en haut de la page

Adblock détecté

Veuillez désactiver votre bloqueur de publicités pour pouvoir visualiser le contenu de la page. Pour un site indépendant avec du contenu gratuit, c’est une question de vie ou de mort d’avoir de la publicité. Merci de votre compréhension!