PUNIR l’acte ou l’organisation des actes ?
(D’après "La nature et la pensée" de Grégory Bateson)
1. Le dauphin reçoit un coup de sifflet et de la nourriture s’il reproduit un comportement qu’il est en train de réaliser au moment d’un premier coup de sifflet. Ceci au cours d’une séance de 10 à 20 minutes.
2. Lors de la séance suivante, il ne reçoit une récompense que s’il répète un comportement différent de celui de la première séance.
L’animal n’est jamais récompensé pour un comportement qui a déjà été récompensé dans une des séances précédentes.
3. Pendant les 14 premières séances, le dauphin fait beaucoup de répétitions infructueuses de comportements récompensés durant la séance immédiatement précédente. Un nouveau comportement apparait seulement accidentellement.
4. Entre la 14e 15e séance, le dauphin parait très excité et à la 15e séance il fait une exhibition compliquée comprenant huit comportements, dont quatre totalement nouveaux, encore jamais observés dans cette espèce.
Pendant les 14 premières séances, il était parfaitement adapté à un contexte expérimental où il s’agissait de reproduire un comportement donné.
’Lorsqu’il pénètre dans le bassin, je le regarde et s’il accomplit un comportement donné que je veux qu’il répète, je donne un coup de sifflet et il en reçoit de la nourriture.’
L’ animal a appris un certain nombre de règles simples plaçant divers éléments dans un organigramme, une structure contextuelle : ses actions, le coup de sifflet, le bassin et le dresseur. Mais cet organigramme ne convient plus dans un autre contexte expérimental où il s’agit d’exhiber un comportement nouveau.
Il lui faut, pour s’adapter à ce nouveau contexte, comparer des informations portant sur un échantillon de contextes différents les uns des autres. Et tout à coup la contradiction est surmontée, une règle devient perceptible, c’est un apprentissage d’un type logique plus élevé : l’animal passe d’une information sur un événement à une information sur une classe d’événements, un ensemble d’événements.
Note : il y a beaucoup de choses qu’on peut apprendre à partir d’un seul exemple mais il faut une multiplicité d’exemples pour apprendre quelque chose sur la nature de l’échantillon d’une classe d’événements ou sur le contexte d’un événement (apprentissage de l’abstraction)
Punir le crime ? d’après Gregory BATESON, dans ’La nature et la pensée’, PUF, 1978
Cf. l’apprentissage des concepts.
Exemples : exploration, discrimination, divination, jeu, dépendance, autonomie, crime. Ce ne sont pas des actions simples (qui sont, elles, renforçables selon les règles du conditionnement opérant) mais des façons d’organiser des actions simples. Et ces ’façons d’organiser’ sont d’un niveau logique supérieur aux actions simples.
Exemple de l’exploration.
On ne peut désapprendre à un rat à explorer. Même en lui donnant des décharges électriques quand il inspecte des boîtes, le rat n’apprend pas à ne pas mettre son museau dans les boites : il apprend seulement à ne pas mettre son museau dans des boites particulières qui ont délivré des décharges électriques quand il les a inspectées. (apprendre à ne pas explorer serait un apprentissage d’un niveau logique supérieur comme pour le dauphin à la 15e séance). Apprendre sur le particulier n’est pas apprendre sur le général.
Nous supposons souvent qu’interdire un comportement (particulier) à un enfant va automatiquement le conduire à comprendre que tous les comportements de la mēme classe sont interdits.
En fait, le rat n’a aucun intérêt à apprendre la leçon générale. Son expérience de la décharge, quand il a mis son museau dans une boîte lui indique qu’il a eu raison de mettre son museau dans cette boîte pour obtenir l’information qu’elle délivrait une décharge. De fait, le ’but’ de l’exploration n’est pas de découvrir si l’exploration est une bonne chose mais d’obtenir des informations sur ce qui est exploré. (Bateson, page 132)
Cf. l’intention positive (voir note 1)
Et le concept ’crime’ ?
Nous agissons comme si on pouvait supprimer le crime en punissant certains actes, comme si le ’crime’ était le nom d’un certain type d’actes. Mais le vocable de ’crime’, comme celui ’d’exploration’ (cf. notre rat explorateur plus haut) désigne plus exactement une façon d’organiser des actes : c’est d’un autre ordre logique que des actes simples (tuer, voler...) et ce n’est donc pas soumis aux lois simples du conditionnement opérant. ’Il est donc peu probable qu’en punissant l’acte, on supprime le crime’.
Punir le crime ? d’après Gregory BATESON, dans ’La nature et la pensée’, PUF, 1978
’Il est très différent de vouloir faire des changements sérieux dans l’état caractérologique d’un organisme ou d’essayer d’en changer les actions particulières.’ (Changement paradigmatique aussi difficile qu’un changement épistémologique).
Il faudrait peut-être même considérer que l’acte précis pour lequel le condamné a été puni d’emprisonnement ne constitue pas le centre même de la rééducation en profondeur. Celle-ci devrait s’attacher à la façon d’organiser son action : c’est celle-ci qui devrait être punie.
(Comment il s’est organisé dans la chaîne de comportements pour en arriver immanquablement à commettre son crime ? En PNL, on pourra même analyser la séquence comportementale en termes d’étapes sensorielles : ’je vois cela (visuel), je ressens (kinesthésique), je me dis que (auditif interne), j’imagine que (visuel interne), etc...)
Exemple : le jeu.
Les mammifères savent reconnaître le jeu. Les actes particuliers (actes simple) qui constituent une séquence donnée de jeu peuvent se produire dans d’autres sortes de séquences, naturellement (c’est d’ailleurs le propre du jeu que les détourner des actes de leur contexte original).
Cf le jeu entre espèces animales différentes (chien–singe, ou dauphin-homme). Ce qui est propre au jeu, c’est une organisation différente de ces actes de celle qu’ils auraient dans le non-jeu : un contexte propre au jeu et que mammifères comme humains savent repérer, sur lequel ils savent ’meta-communiquer’. S’ils jouent à se battre, ils ’savent’ que c’est sous forme de jeu, ils sont capable de méta- communiquer : ’ceci est un jeu’.
Le jeu n’est pas le nom d’un acte ou d’une action c’est le nom d’un cadre où se situe l’action. Il n’est dès lors pas soumis aux règles normales du renforcement. Quiconque a essayé d’interrompre des enfants en train de jouer en sort exaspéré parce que tous les efforts sont inclus dans le jeu dont ils deviennent partie intégrante.
Il y a d’autres cas obéissant aux mêmes règles, c’est-à-dire des cadres de comportement
- - qui ne définissent par les actions qui en forment le contenu
- - qui n’obéissent pas aux règles de renforcement habituel.
- Aux cas d’ ’exploration’ et de ’crime’. On peut ajouter : ’comportement de type A’, ’paranoïa’, ’schizophrénie’. J’ajouterais aujourd’hui ’terrorisme’, ’djihadisme’ et ’complotisme’.
Punir le crime ? d’après Gregory BATESON, dans ’La nature et la pensée’, PUF, 1978
On l’a vu pour l’exploration (Cf. l’exemple du rat explorateur.) : • Premier niveau de description : j’explore (description primaire) • Deuxième niveau : l’exploration est auto-validante. Elle est forcément fructueuse quelque soit son résultat. Elle peut d’ailleurs devenir une passion, entraîne une dépendance.
Idem pour des thèmes relationnels comme ’fierté’, ’admiration’ : ils S’AUTO-VALIDENT. C’est comme pour le ’jeu’, ’l’exploration’, le ’crime’ ou le ’comportement de type A’, qui sont des catégories d’organisation contextuelles de comportement, et pas des seuls comportements.
L’autonomie aussi est une façon d’organiser ses actes de sorte qu’une structure récursive (feed-back, ou boucle porteuse d’information) permette un autoréglage.
Exemple : le chat organise son bond pour qu’il s’auto-corrige en route de façon à aboutir à l’endroit où sera la souris quand le chat atterrira. Pour comprendre cela il est sorti de l’épistémologie traditionnelle : il a effectué un changement épistémologique.
Les boucles sont porteuses de messages sur le comportement du système dans son ensemble.
L’apprentissage des contextes de la vie doit être envisagé du point de vue de l’interaction entre deux êtres vivants. Or la relation est toujours le produit d’une double description, une double vision ou vision binoculaire.
Il est donc important de valoriser un apprentissage du contexte qui émane d’une double description, d’une interaction, qui introduit la relativité (la troisième position, au delà de la première - mon point de vue - , de la seconde - le point de vue de l’autre -, il y a le point de vue de celui qui regarde d’une troisième position ce qui se passe entre les deux autres).
Michel Simonis, d’après Gregory Bateson , 28 juillet 2016
(1) Un comportement négatif est sous-tendu par une intention positive. (’je fume pour me détendre’, ’je bois pour oublier’). En intervention PNL, on va donc dissocier le comportement de l’intention et entrer en contact avec ’la partie’ de soi qui a cette intention positive et qui - dans le but de cette intention - génère un comportement inadéquat, et on va lui demander (c’est un travail de dialogue interne que l’intervenant va conduire) de trouver trois manières au moins de satisfaire son intention positive autrement qu’elle le faisait d’habitude (par exemple, ’pour me détendre, je vais m’offrir un massage’ quand je me sens tendu’). Trois au moins, parce que si non n’a que deux possibilités, on a un dilemme et pas un choix.)
Punir le crime ? d’après Gregory BATESON, dans ’La nature et la pensée’, PUF, 1978