2: Recherche, identification et analyse des articles consacrés à l’utilité diagnostique des tests et mesures cliniques

Chapitre 2 Recherche, identification et analyse des articles consacrés à l’utilité diagnostique des tests et mesures cliniques





La recherche bibliographique


L’adoption d’une stratégie de recherche bibliographique efficace et pointue est indispensable si on veut localiser tout article basé sur les niveaux de preuves.


Quelques-uns des moteurs de recherches les plus utilisés sont : Medline, Excerpta Medica (EMBASE) et l’Index cumulatif en sciences de l’infirmière et sciences de la santé, (Cumulative Index of Nursing and Allied Health Literature (CINAHL).



Medline


Medline est la base de données la plus largement utilisée. Elle contient plus de 7 millions de références et liste plus de 3 500 journaux. Elle est indexée par la US National Library of Medecine grâce au vocabulaire publié dans Medical Subject Headings (MeSH) [3].


Le MeSH est un vocabulaire spécialisé en médecine, désignant les concepts majeurs inclus dans la base de données [4]. Toute nouvelle entrée dans la base de données est indexée au moyen du MeSH, lequel répartit la nouvelle entrée dans de plus petites bases de données, à l’intérieur de Medline, accompagnée de descriptions courtes et spécifiques.


Une demande Medline doit être faite au moyen des termes MeSH appropriés ou bien par mots-clés.


La recherche par mots-clés impose l’utilisation d’un ou de plusieurs mots contenus dans le titre ou le résumé de l’article cherché. MeSH crée un lien direct entre, à la fois, les articles directement associés et ceux proches de celui demandé, à l’intérieur de la base de données.


Une combinaison de MeSH et de mots-clés pour une recherche, donne la façon la plus efficace d’obtenir des résultats complets et pertinents dans Medline (c’est-à-dire être quasi sûr de détecter tous les articles pertinents de la base de données) ; en comparaison avec une simple recherche par mots-clés ou bien au moyen du MeSH.





L’efficacité des recherches dans les bases de données


Les recherches dans les bases de données des articles demandés ne se font pas seulement au travers des mots-clés et des en-têtes du MeSH. Les moteurs de recherche ont tous des niveaux différents de reconnaissance et de précision.


La notion de reconnaissance est le pourcentage d’articles identifiés avec précision au moyen de mots-clés, comparé au nombre d’articles se référant aux mêmes mots-clés et contenus dans la base de données [4]. La formule pour évaluer le taux de reconnaissance est la suivante :




image



Le taux de reconnaissance peut être considéré comme la sensibilité de la recherche. C’est-à-dire que le taux de reconnaissance décrit la capacité d’une stratégie particulière de recherche à sélectionner les articles appropriés par rapport à ceux disponibles [4]. Ce taux de reconnaissance est important pour ceux qui veulent identifier avec pertinence des articles spécifiques sans perdre de temps à passer en revue de trop nombreux résumés [8].


La précision d’une recherche fait référence au pourcentage d’articles ciblant avec précision la recherche parmi ceux détectés [4]. La précision peut être comparée à une notion de valeur prédictive positive : parmi tous les articles identifiés comme pertinents (positif) par le moteur de recherche, quel pourcentage est ce jour-là pertinent (c’est-à-dire se référant ce jour-là à la pathologie incriminée) [3] ? La précision est le plus souvent d’une très grande importance pour les chercheurs qui mènent une revue de la littérature exhaustive. Elle peut être évaluée au moyen de la formule suivante :




image



À l’occasion d’une recherche sur Medline d’articles se référant à l’utilité diagnostique, la recherche la plus efficace nécessite les mots-clés suivants : sensitivity, specificity, false-negative et accuracy [9]. Une telle méthode de recherche montre un taux de reconnaissance de 80 % et une précision de 48 % [9].


Le « nombre de lectures nécessaires » (NLN) est un indicateur du nombre de citations ou de résumés qu’il est nécessaire de lire avant qu’un article pertinent soit identifié [10]. On calcule ce nombre en divisant 1 par la précision.


Les cliniciens peuvent trouver impressionnant qu’une recherche bien menée sur EMBASE ait un résultat de NLN de 27 avec des limites d’intervalle de confiance à 95 %, comprises entre 21 et 34,8 [10].


Cela signifie que, pour toute recherche sur EMBASE, le clinicien doit lire 27 citations ou résumés avant de rencontrer un article pertinent. Quand des intervalles de confiance de 95 % sont pris en considération, le NLN peut augmenter jusqu’à 34.



Analyse critique


Une fois que les articles les plus pertinents ont été détectés, l’étape suivante est l’analyse critique de leur contenu en terme de rigueur méthodologique. Il a été relevé que les qualités méthodologiques des études menées pour l’investigation de l’utilité diagnostique d’un examen clinique sont inférieures à celles menées pour l’efficacité des traitements [11,12].


Les études possédant une faille méthodologique et concluant malgré tout à l’efficacité d’une technique peuvent, malheureusement, conduire à rejeter prématurément cette technique, la rangeant dans la catégorie des techniques inefficaces. Il pourrait en résul ter un diagnostic imprécis et une pauvreté dans le choix des techniques de rééduca tion. À l’opposé, la connaissance et l’utilisation rigoureuse de tests cliniques d’évaluation doivent améliorer la prise en charge des patients et les résultats finals.


Un groupe scientifique, provenant de différentes disciplines, a récemment formé un « Comité de direction pour une diffusion standardisée de diagnostics précis (DSDP) ». Le but est d’améliorer la qualité méthodologique des études menées pour une meilleure précision des diagnostics [13].


Le Comité DSDP se réfère à un test ayant subi un examen scientifique approfondi comme un test « catalogue »1. La précision d’un diagnostic est évaluée (d’après) la concordance entre les résultats de ce test « catalogue » et celle d’une référence standard [13].


Le Comité DSDP a développé une liste de contrôle de 25 éléments à utiliser pour tester la rigueur scientifique d’une étude (tableau 2-1). Cette liste de contrôle a été conçue en rapprochant les résultats d’un grand nombre de recherches, puisées dans la littérature et possédant 33 arrangements méthodologiques de 75 éléments chacun [13,14]. Cette liste de contrôle est divisée selon le découpage habituel des articles : titre, introduction, méthode, résultats et discussion.


Tableau 2-1: Liste de contrôle pour des articles décrivant la précision du diagnostic.















































































































Découpage et thème Numéros des éléments  
Titre, résumé, mots clés 1 Identifier l’article comme une étude sur la précision du diagnostic (en-tête MeSH recommandés :- « sensitivity et sensibility »).
Introduction 2 Faire état de la problématique de la recherche, telle que l’évaluation de la précision d’un diagnostic ou la comparaison de la précision entre des tests ou bien encore selon différents groupes de participants.
Méthodes
Population 3 Description de la population étudiée : les critères d’inclusion et d’exclusion, lieux et endroits où les données ont été recueillies.
  4 Description du mode de recrutement de la population : le recrutement était-il basé sur des symptômes, sur des résultats à des précédents tests ou sur le fait que les participants sont conformes au test « catalogue » ou à la référence standard ?
  5 Description de l’échantillon de population : la population étudiée est-elle formée de séries contiguës définies par les éléments 3 et 4 ? Si non, le mode de sélection ultérieur des participants doit être expliqué.
  6 Description de la collecte des données : la collecte des données était-elle planifiée avant le test« catalogue » et le test standard (étude prospective) ou bien après (étude rétrospective) ?
Méthodes utilisées 7 Description de la référence standard et sa logique.
  8 Descriptions des spécifications techniques du matériel et des méthodes utilisé(e)s, incluant comment et quand les mesures ont été faites, et/ou citer les références des tests « catalogue » et de la référence standard.
  9 Description de la définition et de la logique pour le choix des unités, les limites et/ou les catégories de résultats des tests « catalogue » et de la référence standard.
  10 Description du nombre, de l’entraînement et des connaissances des personnes qui exécutent et lisent les tests « catalogue » et le référence standard.
  11 Description si oui ou non les lecteurs des tests « catalogue » et de la référence standard sont aveugles (masqués) aux résultats des autres tests et donner toute autre information clinique disponible pour le lecteur.
Méthodes statistiques 12 Description des méthodes de calcul ou de comparaison des mesures de précision diagnostique et des méthodes statistiques pour quantifier les incertitudes (par ex. : un intervalle de confiance de 95 %).
  13 Description de la méthode pour calculer la reproductibilité du test si celui-ci est fait.
Résultats
Population 14 Faire état de la date de l’étude, incluant les dates de début et de fin de la période de recrutement de la population.
  15 Faire état des caractéristiques cliniques et démographiques des participants (par ex. : âge, sexe, différents niveaux de symptômes, facteurs de comorbidité, traitements suivis et les lieux de recrutements.
  16 Faire état du nombre de participants satisfaisant les critères d’inclusion et qui ont ou qui n’ont pas subi les
tests « catalogue » et/ou la référence standard ; décrire pourquoi certains participants n’ont pas pu participer à ces tests (un organigramme est fortement recommandé).
Résultats des tests 17 Faire état de l’intervalle temps entre les tests « catalogue » et la référence standard, ainsi que tout
traitement fait entre.
  18 Faire état de la répartition et de la sévérité des maladies (définir les critères) incluses dans les conditions cible (critères d’inclusion) ainsi que celles externes aux conditions cible (maladies présentes mais en dehors des critères d’exclusion).
  19 Faire état d’une tabulation croisée des tests « catalogue » (incluant les résultats manquants ou indéterminés) par ceux de la référence standard ; pour les résultats continus, la distribution des résultats comparés à ceux de la référence standard.
  20 Faire état de n’importe quel événement contraire en conduisant les tests « catalogue » et la référence standard.
Estimations 21 Faire état des estimations de précision du diagnostic et des mesures d’incertitude statistique (par ex. : un intervalle de confiance de 95 %).
  22 Faire état de la manière dont les résultats indéterminés, les réponses manquantes hors champs des tests « catalogue » ont été traités.
  23 Faire état de l’estimation de la variabilité de la précision du diagnostic entre les sous-groupes de participants, les lecteurs des résultats et les centres où sont les patients (si cela a été fait).
  24 Faire état de l’estimation de la reproductibilité du test, si cela a été fait.
DISCUSSION 25 Discuter de l’applicabilité clinique des résultats de l’étude.

Reproduit avec l’aimable autorisation de Bossuyt P, Reitsma JB, Bruns DE, et al. Towards complete and accurate reporting of studies of diagnostic accuracy: the STARD initiative. Clin Chem. 2003 ;49:1-6.


Stay updated, free articles. Join our Telegram channel

Jun 25, 2017 | Posted by in MÉDECINE INTERNE | Comments Off on 2: Recherche, identification et analyse des articles consacrés à l’utilité diagnostique des tests et mesures cliniques

Full access? Get Clinical Tree

Get Clinical Tree app for offline access