Service médical rendu, évaluation et qualité de vie
Evaluation and quality of life in THA revision
F. Molinier12, J.-M. Laffosse1, F. Paumier1, H. Bensafi1 and B. Chaminade1
1Institut locomoteur, service orthopédique et traumatologique, CHU Rangueil-Toulouse, 31059 Toulouse cedex 9;
2Laboratoire d’anatomie, Faculté de Médecine Rangueil, 31062 Toulouse cedex
Résumé
L’évaluation qualitative des résultats thérapeutiques est à l’heure actuelle nécessaire et obligatoire. Cette évaluation peut être réalisée par le praticien, par un observateur indépendant ou par un organisme de santé publique. Si l’objectif est le même, à savoir proposer un soin de qualité adapté à chaque patient, les décisions prises sur les moyens, après l’analyse des résultats, peuvent différer en fonction des impératifs de chacun. En chirurgie orthopédique, il existe différentes échelles d’évaluation. Certaines, grâce à des critères précis centrés sur l’articulation, évaluent de manière objective les résultats fonctionnels : score de Harris et cotation PMA. D’autres étudient avec des critères subjectifs, le handicap et la qualité de vie du patient. Ainsi, le SF-36, facile à réaliser, évalue dans sa globalité la qualité de vie des patients après mise en place d’une arthroplastie totale de hanche. Cependant, certains facteurs extrinsèques comme l’âge, peu pris en compte dans les scores d’évaluation, ne doivent pas être négligés car ils peuvent intervenir dans l’analyse des résultats. Dans le cadre de la chirurgie de révision des prothèses de hanche, sur ces dix dernières années, les auteurs utilisent principalement le score de Harris pour évaluer leurs résultats. Seules quatre séries utilisent des scores de qualité de vie : le WOMAC (2 fois), le SF 36, et l’EuroQol. Ce dernier semble particulièrement intéressant chez les sujets âgés, car il prend plus en compte le facteur âge que les autres scores. En conclusion, il est, à l’heure actuelle, pour des raisons médicales, sociologiques et économiques, nécessaire d’évaluer la qualité de vie des patients après une intervention chirurgicale. Le thérapeute possède des outils intéressants de plus en plus utilisés dans notre spécialité.
Mots clés :
Summary
Today, evaluation of the quality of surgical results is necessary and mandatory. This evaluation can be carried out by a practitioner, an independent observer or a public health organisation. While in each case the objective is similar, to propose good quality care adapted to the needs of each patient, the type of decisions resulting from the analysis could be different according to the aims of evaluation.
Several evaluation scales are available in orthopaedic surgery, some of which are based on studies of joints and provide an objective analysis of functional results, such as the Harris and PMA scores. Others use subjective criteria to evaluate patient handicap and quality of life. The SF-36, easy to carry out, evaluates the global quality of life of patients. It may be used after total hip arthroplasty. However, some extrinsic factors, such as the age of the patient, are not always taken into account in evaluation scores, despite the fact that these factors are necessary for a balanced analysis of results.
Over the past ten years, the authors have used mainly the Harris score to evaluate the results after revision surgery in hip arthroplasty. Only four series use a quality of life scale: WOMAC (twice), SF-36 and EuroQol. The EuroQol appears of interest with elderly people, as it takes age into account more than the others. To conclude, for medical, sociological and economic reasons, it is essential to evaluate quality of life of our patients after surgery. The various tools available for such analyses are becoming more attractive and useful in our daily practice.
Introduction
«L’évaluation de la qualité est aujourd’hui vue comme un impératif défini dans le cadre de la loi. Face à cette obligation, les médecins, en charge de l’évaluation de la qualité des soins, se trouvent face à des impératifs contradictoires : établir l’évaluation comme un travail valorisant, reposant sur une base scientifique incontestable; mettre en place des procédures d’évaluation de qualité dans un contexte politique où la décroissance des coûts est très souvent mise en avant, c’est-à-dire avec peu de moyens.» [11].
Depuis la Seconde Guerre mondiale, quatre phases de l’évaluation des résultats en chirurgie se sont succédées. Tout d’abord, l’évaluation réalisée par le chirurgien se fondait sur la clinique et l’anatomie fonctionnelle. Ensuite, sont apparues les classifications radiologiques permettant les comparaisons. Puis la troisième phase prenait plus en compte le patient et le développement de groupes internationaux de travail a permis d’élaborer des scores consensuels et impersonnels, toujours évalués par le praticien. Enfin, la dernière phase fait intervenir directement le patient par des questionnaires d’autoévaluation et de satisfaction pouvant être complétés au domicile [15].
Tout acte thérapeutique nécessite une évaluation des résultats par rapport aux objectifs fixés. Depuis 2005, l’évaluation des pratiques professionnelles est aussi obligatoire. Les classifications et les scores fonctionnels permettent de classer des lésions, d’orienter la stratégie thérapeutique et d’évaluer les résultats et les complications. Cependant, les résultats seront analysés différemment par les différents acteurs de la santé : le thérapeute, l’observateur indépendant ou l’organisme de santé publique.
Le praticien évalue les résultats lors de la consultation avec son patient dans le cadre d’une relation contractuelle couverte par le secret médical. Cette évaluation est fondée en grande partie sur l’expérience et la subjectivité. En fonction des résultats et des données scientifiques, il est proposé au patient une poursuite ou une modification de la thérapeutique et une réévaluation lors d’une prochaine consultation. Le médecin, quant à lui, est conforté ou non dans son choix thérapeutique. Il peut ainsi modifier, ou non, son exercice médical.
Dans le cadre d’une étude clinique, un observateur indépendant, médical ou non, peut être nommé pour plus d’objectivité. Il évalue les patients à l’aide d’outils cliniques, plus ou moins standardisés, appelés échelle ou score. L’objectif, au cours de l’évaluation, est de récupérer un maximum de données objectives prédéfinies à l’avance. Ensuite, ces données sont analysées statistiquement pour comparer par exemple deux thérapeutiques différentes.
Enfin, les organismes de santé publique réalisent les évaluations des thérapeutiques pour permettre, entre autres, leur autorisation de mise sur le marché (AMM) et fixer les taux de remboursement avec le service médical rendu (SMR) et l’amélioration du service médical rendu (ASMR). Les conclusions sont prises en fonction des résultats d’études scientifiques et cliniques financées par les laboratoires pharmaceutiques, en fonction des données bibliographiques et parfois en fonction de l’avis d’expert dans le domaine particulier étudié. Les organismes de santé publique fixent aussi les règles de bonne pratique médicale dans l’objectif d’une diminution des coûts de santé.
Chacune des trois techniques d’évaluation présente des avantages et des inconvénients. Dans le premier cas, le praticien réalise une évaluation personnalisée, au cas par cas, avec un fort risque de subjectivité. L’observateur indépendant réalise une étude plus objective avec l’utilisation d’outils généraux pouvant être imparfaits. Ces outils sont adaptés à une population sélectionnée pour l’étude ou à une technique thérapeutique particulière et donc les résultats sont souvent difficilement généralisables à l’ensemble de la population. Enfin, avec les organismes de santé publique [15], il existe un risque d’interposition de la société entre le médecin et la malade. En effet, les données recueillies sont digitalisables et exploitables par ordinateur. Des évaluations systématiques, réalisées par les organismes de santé en dehors de toute notion thérapeutique, pourraient aboutir à des décisions prises par les non-médecins.
La distance entre le clinicien et l’organisme de santé publique semble grande mais les objectifs sont communs : assurer une prise en charge diagnostique et thérapeutique de qualité pour chaque patient. Pour le clinicien, la démarche de qualité se définit par l’apport au patient d’une information claire loyale et appropriée sur l’état de santé, la nature des examens et des traitements entrepris. Ces derniers sont adaptés en fonction de l’état du patient, des données scientifiques et de l’expérience du thérapeute. L’organisme de santé publique doit garantir aux patients un personnel soignant formé et qualifié, ainsi qu’un plateau technique de qualité, au coût le plus faible. Les deux intervenants ont vis-à-vis du patient une obligation de moyens. Pour contrôler la qualité des soins, il est donc nécessaire de réaliser des évaluations qui peuvent opposer l’approche humaniste du patient réalisé par le médecin à la démarche comptable de l’organisation du système de soins.
La Haute autorité de santé (HAS), pour évaluer les résultats des études cliniques, fixe un niveau de preuve en fonction de la méthodologie utilisée [13, 49]. Il s’agit de la médecine fondée sur les preuves ou «evidence based medecine» des Anglo-saxons. La pertinence des questions posées, l’évaluation clinique du bénéfice pour le patient et l’applicabilité à l’exercice de la médecine au quotidien sont trois critères fondamentaux pour juger du niveau de preuve des études scientifiques. Une méthodologie rigoureuse est nécessaire pour mesurer l’effet sans biais ainsi que pour démontrer un lien de causalité sans ambiguïté. En fonction du niveau de preuve, la HAS élabore des recommandations pour la pratique de l’exercice médical.
Les études en médecine, sur les médicaments afin d’évaluer leur efficacité thérapeutique, utilisent des critères objectifs cliniques standardisés. La méthodologie du protocole d’étude et le recueil des données sont rigoureux, conférant un fort niveau de preuve aux résultats. Les médecins et les laboratoires pharmaceutiques semblent disposer d’outils scientifiques pertinents et objectifs permettant de prouver aux autorités de la santé le bien fondé de la thérapeutique et le service médical rendu.
En chirurgie et en orthopédie, les niveaux de preuve des articles publiés sont plus faibles. Or, l’acte chirurgical apporte dans la grande majorité des cas un bénéfice important pour la majorité des patients. La difficulté réside dans la capacité d’apporter la preuve de l’efficacité du traitement. Les critères utilisés et la durée d’inclusion sont différents en chirurgie par rapport aux études sur le médicament. Par exemple, dans l’arthroplastie totale de hanche, les objectifs de l’acte thérapeutique sont la récupération fonctionnelle, l’indolence et le retour à l’autonomie sociale et/ou professionnelle. Pour juger de l’efficacité du traitement, les reculs sont nécessairement longs avec un minimum de 10 ans. Il est donc difficile et coûteux de suivre une cohorte statistiquement significative sur cette période et donc d’approcher les niveaux de preuve élevé des études sur le médicament.
Après avoir défini les notions théoriques de service médical rendu et de médecine fondée sur les preuves utilisée par la HAS, nous évaluerons les niveaux de preuve des études réalisées en chirurgie orthopédique. Ensuite, nous étudierons les critères d’évaluation utilisés dans notre spécialité (score de Harris, PMA, WOMAC, etc.) et ceux utilisés plus précisément dans les études sur les arthroplasties totales de hanche de deuxième intention. Nous évaluerons la pertinence et l’objectivité de ces critères d’évaluations par rapport aux populations étudiés et au geste chirurgical pratiqué. Cette analyse permettra de dégager des pistes de recherche pour l’amélioration des échelles d’évaluation et de nouveaux sujets d’études prospectifs à fort niveau de preuve.
Définition
Service médical rendu [19]
Le niveau de service médical rendu par un médicament détermine son degré de prise en charge par l’assurance maladie obligatoire.
Le SMR est un critère qui prend en compte plusieurs aspects :
• d’une part la gravité de la pathologie pour laquelle le médicament est indiqué;
• d’autre part des données propres au médicament lui-même dans une indication donnée :
– efficacité et effets indésirables;
– place dans la stratégie thérapeutique (notamment au regard des autres thérapies disponibles) et existence d’alternatives thérapeutiques;
– intérêt pour la santé publique.
En fonction de l’appréciation de ces critères, plusieurs niveaux de SMR ont été définis :
• SMR majeur ou important;
• SMR modéré ou faible, mais justifiant cependant le remboursement;
• SMR insuffisant pour justifier une prise en charge par la collectivité.
Le SMR d’un médicament est mesuré à un moment donné. Il peut évoluer dans le temps et son évaluation se modifier, notamment lorsque des données nouvelles sur lesquelles son appréciation se fonde sont produites, ou lorsque des alternatives plus efficaces apparaissent.
Depuis 2001, la quasi-totalité des médicaments remboursables par l’assurance maladie dispose d’un de SMR.
Amélioration du service médical rendu [44, 48]
L’amélioration du SMR d’un médicament s’apprécie en le comparant à un autre médicament d’une même classe thérapeutique. La Commission de transparence évalue l’ASMR en cinq niveaux en termes d’amélioration et/ou du profil d’effets indésirables et/ou de commodités d’emplois. L’ASMR est différente du SMR qui évalue un médicament (efficacité, profil des effets indésirables, caractère préventif, symptomatique ou curatif, gravité de l’affection traité et intérêt pour la santé publique) sans apprécier cependant l’amélioration apportée par rapport aux médicaments déjà disponibles.
L’ASMR est côté en six niveaux :
• 1 : progrès thérapeutique majeur;
• 2 : amélioration importante en termes d’efficacité thérapeutique et/ou de réduction des effets indésirables;
• 3 : amélioration modeste en termes d’efficacité thérapeutique et/ou de réduction des effets indésirables;
• 4 : amélioration mineure en termes d’efficacité et/ou d’utilité :
– au plan clinique : acceptabilité, commodité d’emploi, observance;
– complément de gamme justifié;
– avantage potentiel lié aux propriétés pharmacocinétiques ou au moindre risque d’interactions médicamenteuses;
• 5 : absence d’amélioration avec avis favorable à l’inscription;
• 6 : avis défavorable à l’inscription.
Commission de transparence [19, 48]
La Commission de transparence est une instance scientifique composée de 20 membres titulaires, médecins, pharmaciens ou spécialistes en méthodologie et épidémiologie. Elle comprend des médecins hospitaliers et des médecins libéraux, spécialistes et généralistes. Dans ses travaux d’évaluation du médicament, la Commission sollicite en outre l’avis d’experts.
La Commission évalue les médicaments ayant obtenu leur AMM lorsque le laboratoire qui les commercialise souhaite obtenir leur inscription sur la liste des médicaments remboursables.
Elle a notamment pour mission :
• de donner un avis aux ministres en charge de la santé et de la Sécurité sociale sur la prise en charge (par la Sécurité sociale, et/ou pour leur utilisation à l’hôpital) des médicaments;
• de contribuer au bon usage du médicament en publiant une information scientifique pertinente et indépendante sur les médicaments, leur place dans la stratégie thérapeutique, et les résultats de l’évaluation de leur SMR, ainsi que l’amélioration qu’ils sont susceptibles d’apporter par rapport aux traitements déjà disponibles (ASMR).
La Commission de transparence est une commission spécialisée de la HAS, autorité indépendante à caractère scientifique. En application du code de la Sécurité sociale qui lui permet d’adopter des «recommandations sur le bien-fondé et les conditions de remboursement d’un ensemble de soins ou catégories de produits ou prestations», le Collège de la HAS, qui en constitue l’instance délibérante, émet la présente recommandation. Pour ce faire, elle s’appuie sur les résultats de l’évaluation scientifique effectuée par la commission de transparence. Le Collège de la HAS a fait sien les avis de la Commission de transparence et a souhaité accompagner leur publication de précisions portant sur certaines classes thérapeutiques.
La médecine fondée sur les preuves et niveaux de preuve
La multiplication des données scientifiques de qualité inégale et la nécessité d’évaluer de manière efficace les résultats publiés pour une bonne pratique professionnelle ont fait naître le concept d’«evidence based medecine» ou médecine fondée sur les preuves.
La pertinence des questions posées, l’évaluation clinique du bénéfice pour le patient et l’applicabilité à l’exercice de la médecine au quotidien sont trois critères fondamentaux pour juger du niveau de preuve des études scientifiques.
Une méthodologie rigoureuse est nécessaire pour mesurer l’effet sans biais ainsi que pour démontrer un lien de causalité sans ambiguïté.
Les niveaux de preuve permettent de classer la valeur des articles dans les journaux scientifiques (inclus dans le Journal of Bone and Joint Surgery depuis 2003); de sélectionner les résumés de congrès (utilisation par la Société d’orthopédie pédiatrique nord-américaine depuis 4 ans); de développer les règles de bonne pratique clinique; et d’orienter la pratique chirurgicale avec les résultats d’articles à fort niveau de preuve [53].
Ainsi, en fonction de la méthodologie, la HAS attribue un niveau de preuve à chaque article [13, 49] :
• niveau 1 : il regroupe les grands essais contrôlés randomisés avec résultats bien tranchés associés à un faible taux d’erreur a et b (puissance forte);
• niveau 2 : petites études randomisées avec résultats incertains (risque élevé d’erreur et/ou faible puissance), susceptibles d’être transformées en niveau 1 par méta-analyse;
• niveau 3 : essais prospectifs non contrôlés bien menés (suivis de cohorte);
• niveau 4 : comparaison de cohortes d’époques et de lieux différents;
• niveau 5 : séries de cas sans contrôle.
L’essai thérapeutique contrôlé randomisé est donc le «gold standard» de la recherche clinique. Sa méthodologie rigoureuse lui permet de bénéficier du meilleur niveau de preuve. Élaborée pour les études médicales et donc bien adaptée à elles (utilisation d’un principe actif), cette méthodologie peut-elle s’adapter aux études réalisées en orthopédie?
Niveaux de preuve en chirurgie orthopédique et traumatologique
En orthopédie et en traumatologie, chaque chirurgien, en charge de son patient, effectue dans sa pratique quotidienne, des choix thérapeutiques faisant référence à des niveaux de preuve différents [14].
Il peut s’agir d’un acte fortement argumenté par des données scientifiques, ou des données issues d’une réflexion collective dans le cadre de conférences de consensus, mais souvent le choix est personnel, fondé sur l’expérience, empreint d’une forte subjectivité.
L’évolution de la médecine privilégie désormais les niveaux de preuve aux dépens d’une pratique empirique. Ceci n’exclut pas la référence à l’expérience, et à l’acquisition du «savoir faire». La décision thérapeutique ne saurait se passer des niveaux de preuve et de la réflexion individuelle du praticien.
En médecine, les études prospectives randomisées sont généralement utilisées en phase 3 du développement d’un principe actif. Les essais de phase 3 sont des études comparatives réalisées pour vérifier l’efficacité d’un produit de diagnostic, de traitement ou de prophylaxie, déterminé dans les études de phase 2. Pendant ces épreuves, les patients sont surveillés étroitement par des médecins afin d’identifier toutes les réactions défavorables d’utilisation à long terme. Ces études sont réalisées sur des groupes de patients assez importants pour identifier médicalement des réponses significatives, et durent habituellement environ trois ans [8]. Au cours de l’étude, le nouveau médicament est comparé soit à un placebo, soit au médicament de référence. Un ou deux critères majeurs de comparaison sont sélectionnés. Ils doivent être cliniques. En fonction de l’événement attendu, le nombre de patients à inclure et le recul nécessaire sont analysés statistiquement avant le début de l’étude. Généralement, la durée d’inclusion des patients dans l’étude est de quelques mois. Ceci permet de limiter les patients perdus de vue. Les résultats sont publiés en intention de traiter. Le principe de l’analyse en intention de traiter stipule que tous les patients randomisés doivent être suivis jusqu’à leur décès, jusqu’à la fin de l’essai, ou jusqu’à l’observation de l’événement, critère de jugement, quelle que soit leur observance au traitement de l’étude [27]. Ceci permet de conserver la comparabilité entre les groupes.
En orthopédie, la majorité des études présente un faible niveau de preuve [3, 9, 43]. En prenant l’exemple de l’arthroplastie de hanche, nous constatons que les différences avec les études en médecine sont nombreuses. Les séries réalisées en orthopédie sur ce sujet se déroulent lors de la phase 4 du développement de la prothèse. Dans la majorité des cas, les études sont rétrospectives et manquent de puissance. Les critères de comparaisons sont multiples, cliniques et radiologiques, et difficilement comparables entre les études traitant d’un même sujet. L’évaluation d’une prothèse nécessite aussi un recul important (supérieur à 10 ans), ce qui augmente le risque de perdus de vue. L’ensemble de ces constations explique la quantité importante de biais retrouvés en orthopédie.
Enfin, s’il ne pose pas de problèmes de comparer un médicament contre un placebo dans les études médicales, cela paraît plus difficile dans notre spécialité. Il est impossible d’établir deux groupes et de simuler une intervention sur un des deux groupes. À ce titre, l’expérience de Moseley et al. [39] est difficilement généralisable à l’ensemble de l’orthopédie.
McCulloch et al. [33] montrent qu’il existe d’autres limites à la réalisation d’essais randomisés en chirurgie :
• l’existence de traitements historiques n’ayant pas fait l’objet d’étude et considéré comme référence aujourd’hui;
• l’omniprésence, chaque jour plus marquée, de la compétition individuelle et commerciale;
• le manque d’expérience en recherche clinique;
• l’apprentissage;
• le contrôle qualité : il est difficile de contrôler à tous les niveaux de la prise en charge chirurgicale (médicale et paramédicale) ainsi que tout le long de l’essai, la qualité des soins apportés;
• l’innovation;
• le traitement à l’aveugle.
Nizard [41] propose quelques pistes de réflexion pour contourner ces difficultés. Au sujet du problème de randomisation, il évoque :
• la randomisation «en grappe» ou «cluster randomisation» : ici, ce n’est pas l’individu mais une communauté (par exemple : employés d’une même entreprise, élèves d’une même école, membres d’une même famille ou patients hospitalisés dans une même institution) qui est l’unité de randomisation; ceci permet d’éviter les disparités entre individus;
• la détermination du traitement en fonction du côté : limite le bruit lié à la variation individuelle;
• la détermination des malades fondée sur l’expertise : intéressante en traumatologie, car pour un traumatisme donné, on apparie un chirurgien à une technique et on attribue le patient au couple chirurgien- technique;
• la randomisation selon Zelen [54] : dans ce cas, la randomisation est effectuée avant la demande de consentement. Seuls les patients du groupe expérimental seront informés de l’étude. Cette technique limite les effets potentiellement délétères sur la relation médecin-malade et limite les refus, en montrant les bénéfices que peut tirer le patient d’une nouvelle technique.
Pour ce qui concerne la taille de l’échantillon, il existe des mesures facilitant le recrutement des patients :
• minimaliser les formulaires d’inclusion;
• contacter les associations de malades;
• confier à des investigateurs la promotion et la formation pour augmenter l’implication des centres d’investigation;
• limiter au maximum les «perdus de vue».