20. Problèmes généraux dans l’évaluation des psychothérapies
Even things that are true can be proved.
Oscar Wilde, Le Portrait de Dorian Gray
L’évaluation des effets et des résultats des psychothérapies s’est développée ces quarante dernières années. Paul (1969) a présenté d’une façon lapidaire l’ensemble des questions que soulève l’évaluation des effets thérapeutiques et des processus en jeu dans les psychothérapies : « Quel traitement, par quel thérapeute, est le plus efficace, pour quel sujet, dans quel problème, dans quelles circonstances, et comment ? » Cette longue phrase interrogative peut donner lieu à sept grandes directions de recherche.
1 Définir avec précision les traitements.
2 Définir l’efficacité thérapeutique.
3 Définir en termes opérationnels les problèmes psychologiques.
4 Définir en termes opérationnels les sujets.
5 Définir les comportements et les attitudes psychologiques qui sont psychothérapiques.
6 Comment agissent les traitements : quels sont le ou les processus thérapeutiques ?
7 Dans quelles conditions de milieu agissent les traitements ?
Mais cet abord pragmatique de la question pose des problèmes généraux d’ordre épistémologique et méthodologique.
Problèmes épistémologiques
Un premier problème est celui de la pertinence d’une évaluation des phénomènes psychothérapiques qui, par nature, sont subtils, individuels, souvent intersubjectifs et de ce fait se prêtent peu à une quantification sur le modèle des sciences expérimentales, qu’elles soient d’obédience médicale ou psychologique. En effet, on peut se demander si la psychothérapie et ses différents modèles ne peuvent pas être classés dans les sciences idiographiques. Autrement dit, les sciences qui s’occupent de phénomènes uniques, non répétables, et dont on ne peut donner qu’une description individualisée. Les sciences idiographiques sont, par exemple, l’histoire, la géographie et l’archéologie. À l’inverse, les sciences nomothétiques s’efforcent de définir des lois, d’établir des relations répétables, de tester des hypothèses de plus en plus générales et de proposer des modèles du fonctionnement psychologique et des modèles d’intervention. Le cas individuel, malgré son ipséité, est supposé « porter en lui-même la forme entière de l’humaine condition » que l’on peut dégager par induction, et repérer chez d’autres individus au cours d’études statistiques.
La recherche en Thérapiepsychanalytiquepsychothérapie oscille en fait entre ces deux pôles nomothétique et idiographique.
Les psychologues, à la suite de Claude Bernard (1865), ont développé des protocoles expérimentaux de cas individuels pour évaluer les effets et les processus des psychothérapies, pour ensuite développer des études contrôlées sur un nombre élevé de cas, afin de valider leur approche en fonction de critères méthodologiques universels (Hersen et Barlow,1976).
Un second problème est celui de la croyance de chaque psychothérapeute en la valeur du système auquel il adhère, croyance dont le fondement est rarement rationnel. Développer un programme de recherche, autrement dit formuler un système psychothérapique sous la forme d’un ensemble d’hypothèses testables, consiste à prendre le risque de voir ses croyances s’effondrer, et d’être obligé de modifier sa pratique. En effet, comme l’a montré Karl Popper (1963), la recherche scientifique est beaucoup moins la quête de la « vérité » que la mise en place de dispositifs de contrôle susceptibles d’éliminer progressivement les erreurs. Popper, dans un ouvrage sur la logique de la découverte scientifique, a formulé un principe selon lequel toute théorie doit pouvoir être mise en défaut par une expérience qui la contredirait. Une théorie qui n’est pas en position d’être contredite, n’est pas scientifique. Nul ne peut l’infirmer ou la confirmer. Cette notion s’appelle « la falsifiabilité ». En fait, la recherche sur les psychothérapies représente une oscillation entre nos croyances irrationnelles et leur mise à l’épreuve expérimentale. Cette oscillation individuel-général, et croyance-falsifiabilité, va se retrouver constamment dans les problèmes méthodologiques soulevés par l’évaluation des psychothérapies.
Problèmes méthodologiques
Hypothèses de recherche et méthodologie
La formulation d’hypothèses de recherche consiste à se poser des questions et à se donner les moyens d’y répondre. Il est évident que, devant le nombre de facteurs qui peuvent influencer le cours d’une psychothérapie, des événements de vie à l’effet placebo, en passant par la méthode thérapeutique utilisée ou des changements biologiques, tout projet de recherche est forcément réducteur. Il a pour but en effet d’établir les règles logiques qui sont nécessaires à la sélection et l’interprétation objective des données recueillies dans le but de répondre aux questions posées. Nous avons parlé d’objectivité, ce qui revient à dire que la subjectivité est importante. Que ce soit dans le choix des questions posées ou dans l’évaluation, qui est fonction de l’observateur et de la méthode d’observation choisie. Ainsi, la méthodologie consiste, de la manière la plus objective possible, à poser les questions et à élaborer un protocole qui permette de répondre à celles-ci, tout en sélectionnant des mesures fiables et adaptées à la question.
Stratégies de recherche
Études de cas individuels
L’histoire de la psychothérapie a débuté par des études de cas individuels rapportés par Charcot, Janet ou Freud. Les statistiques sur des groupes de cas peuvent évaluer les résultats d’un thérapeute ou d’une institution. Mais ces statistiques globales, si elles étudient certains aspects du processus thérapeutique au cours de recherches corrélationnelles, ne permettent pas de conclure à l’efficacité d’un traitement par rapport à l’évolution spontanée ou à un autre traitement.
Protocoles de cas individuels
Une autre méthode d’évaluation que le protocole de groupe randomisé a été proposée par Hersen et Barlow (1976) : les protocoles de cas individuels. Ils consistent à prendre le sujet comme son propre témoin.
L’un des protocoles les plus fiables fait succéder, par exemple, une phase de liste d’attente, une phase d’intervention, suivie d’une phase de non-intervention (ligne de base ou baseline ou ligne de référence), puis d’une nouvelle phase d’intervention (protocole A-B-A-B dans lequel A= intervention, B= non-intervention). Des mesures répétées des variables à l’étude permettent de voir si le sujet a des changements importants durant les phases d’intervention ou s’il s’améliore spontanément, durant les phases sans thérapie. Le protocole le plus utilisé en clinique est le protocole A-B, considéré comme quasi expérimental, qui compare une ligne de base sans intervention à une intervention psychothérapique. Ces protocoles A-B peuvent être effectués sur cinq sujets au moins en décalant dans le temps le moment de l’intervention, ce qui permet avec une statistique adaptée de montrer que les sujets changent après l’intervention. Une autre forme de protocole A-B est le protocole A-B à ligne de base multiple à travers les comportements. Il consiste à agir successivement sur plusieurs comportements en montrant que les changements sont consécutifs à la mise en place de l’intervention, ce qui peut être mis en évidence par simple inspection (figure 20.1). Il s’agit d’un patient qui présente des obsessions-compulsions de trois types : penser compulsivement à des mots qu’il peut avoir oubliés, des vérifications excessives de son travail, et des retours compulsifs sur le passé. Il est suivi en thérapie cognitive durant quinze séances tout en continuant à prendre un comprimé de fluoxétine, traitement établi six mois avant le début de la thérapie. Le schéma montre que les comportements problèmes changent après l’introduction d’une thérapie cognitive spécifique à chacun d’eux et qu’il est possible, sur un suivi de treize mois, d’arrêter la fluoxétine au septième mois. Ce protocole suggère que la thérapie cognitive a eu un effet spécifique sur les obsessions-compulsions du patient alors que le traitement pharmacologique était de peu d’efficacité. Cependant, du fait qu’il existe une seule phase A et non pas une succession A-B-A-B, on ne peut totalement l’affirmer.
![]() |
Figure 20.1 |
À condition d’avoir un grand nombre de points de mesure, une analyse statistique comparative des différentes phases est possible (Hersen et Barlow, 1976 ; Bouvard et Cottraux, 2010). Ces protocoles, beaucoup plus sophistiqués que l’exemple simple que nous avons donné, permettent l’étude individuelle du processus psychothérapique. Ils peuvent être appliqués sur des groupes de sujets en prenant chaque sujet comme son propre témoin. Ils permettent également de résoudre le problème de la comparabilité des sujets, souvent difficile à établir. Leur limitation réside dans la difficulté à généraliser les résultats à partir de cas individuels même effectués en série. Ils représentent surtout un moyen rapide et commode de tester une hypothèse sans engager les frais d’une étude contrôlée ; celle-ci pourra être effectuée secondairement au vu de résultats intéressants.
Protocoles randomisés
Le noyau dur de la recherche est donc représenté par les études comparatives, contrôlées. Cependant, constituer un groupe contrôle pour évaluer une méthode de psychothérapie ne va pas sans problème. En effet, il est pratiquement impossible de comparer après randomisation une psychothérapie active à un « placebo » inerte de psychothérapie sur le modèle des études pharmacologiques. Les phénomènes relationnels et situationnels, et les attentes des thérapeutes et des patients sont des ingrédients actifs de tout système psychothérapique. Plusieurs solutions ont été proposées pour résoudre le problème du placebo de psychothérapie. Le groupe « attention-placebo », avec un contact minimal avec un thérapeute qui n’utilise pas les éléments supposés actifs de la thérapie que l’on veut tester, permet d’éliminer les effets simples de prise en charge. La liste d’attente durant plusieurs mois avec simple contact téléphonique pose des problèmes éthiques et risque d’aboutir à des sorties d’essai vers une autre thérapie. Le contrôle par une pseudo-thérapie ou une antithérapie pose aussi des problèmes éthiques et pratiques. La comparaison d’une thérapie de référence à la thérapie testée pose des problèmes d’interprétation, dans la mesure où la nouvelle thérapie risque d’avoir les bénéfices de la nouveauté et une prime au changement (le « band-wagon effect » des auteurs américains). De même, la comparaison d’une chimiothérapie à la psychothérapie risque d’être biaisée en faveur de la psychothérapie dans la mesure où les patients ont presque tous eu des chimiothérapies inefficaces, sinon ils ne viendraient pas chercher un autre traitement. Le double aveugle est impossible sauf en cas de comparaison d’une thérapie à elle-même, associée à un médicament actif ou un placebo. C’est dire l’importance d’une évaluation indépendante et aveugle aux hypothèses testées. Il n’y a pas de solution idéale, sinon d’évaluer en début de traitement la croyance des patients et des thérapeutes dans le traitement qui a été tiré au sort et d’étudier la corrélation de ces mesures avec les résultats.
Méthodes de mesure
Il existe de nombreuses échelles d’évaluation des symptômes, des comportements et des processus psychothérapiques qui actuellement ont reçu une validation et rendent possible l’étude de problèmes psychopathologiques variés (Bouvard et Cottraux, 2010). Il faut les compléter par des questionnaires de personnalité ou des mesures ad hoc, en fonction des hypothèses testées. Les tests comportementaux in vivo permettent une mesure directe des performances d’un sujet et peuvent différer notablement des échelles d’évaluation. La vidéo ou les enregistrements audio permettent d’évaluer aussi bien les patients que les thérapeutes. Malgré les résistances qu’ils suscitent, ils servent à mettre en évidence aussi bien les processus thérapeutiques que les résultats. En différé, deux juges indépendants et « aveugles » peuvent coter les progrès des patients, le contenu de l’interaction psychothérapique, l’adhérence des thérapeutes aux hypothèses et aux techniques thérapeutiques. Sur le plan des résultats et de leur analyse, deux points sont essentiels :
• une évaluation bien conduite doit avoir des critères et des mesures multiples, de façon à ne pas trop limiter la portée des conclusions ;
• à côté de la variation des scores d’échelles continues, l’évaluation doit utiliser des critères généraux discontinus de bons résultats. En effet, des changements statistiquement significatifs d’une échelle sur un groupe peuvent ne refléter que des résultats cliniques médiocres dont la moyenne suffit à rendre significatifs les tests statistiques. Inversement, l’absence de changement moyen des scores d’échelles peut, plus rarement, s’accompagner de changements cliniques intéressants pour certains patients ou un sous-groupe de patients.
Sélection des sujets
Quelles que soient les méthodes utilisées pour le recrutement des patients : annonces, médias, recrutement dans une consultation hospitalière, étudiants ou volontaires payés comme aux États-Unis, elles sélectionnent un échantillon. L’établissement de critères comme ceux du DSM-III puis DSM-IV (American Psychiatric Association, 1994) et leur compatibilité avec les critères du CIM-10 (OMS, 1992) ont été vivement critiqués dans notre pays. Pourtant, ils représentent la meilleure approximation provisoire qui permette la sélection relativement homogène de sujets pour une étude. Cependant, ils risquent de masquer la spécificité des problèmes individuels et la motivation des patients.

Stay updated, free articles. Join our Telegram channel

Full access? Get Clinical Tree

