Lésions des ischio-jambiers : analyse d'article

Médiamphi - ⏱ 7 min
MédiAmphi a demandé à son pôle scientifique d'analyser la dernière publication 2022  de Tears et al. sur la BAMIC, une des classifications proposée sur les lésons des ischio-jambiers, mais hautement contestée.

Trois questions de recherche sont étudiées dans cet article qui étudie la relation de la BAMIC en tant que facteur prédictif du retour au jeu après une blessure aux ischio-jambiers chez les joueurs de football professionnels :

  • La durée de RTP et le score BAMIC sont-ils corrélés ? C’est-à-dire est-ce que le score issu de la classification BAMIC des blessures des ischios-jambiers (HSI) est un prédicteur utile du délai RTP chez les footballeurs professionnels ?
  • Des paramètres du score BAMIC, comme la cross-section de la blessure et la taille de l’œdème, permettent-ils de prédire la durée de RTP ?
  • Quel est le degré de concordance entre la classification BAMIC et la classification de Peetrons modifiée ? Cet objectif semble flou et amène à questionnements (cf analyses statistiques) car à l’origine les deux classifications sont différentes du fait de leurs définitions et critères de classement. La pertinence serait en premier lieu de voir si la prédiction de délai RTP est similaire ou différente selon les 2 classifications puis dans un second temps d’étudier la correspondance entre grades de chaque classification et prédiction du délai RTP afin de voir si des conversions d’un grade d’une classification à l’autre sont possibles.
Pour répondre à ces objectifs, une étude rétrospective permet de revenir sur 9 années consécutives (2010 à 2019) d’un club de football incluant des joueurs professionnels adultes (≥18 ans). Sur les 9 années, 30 joueurs remplissent les critères d’inclusion (HSI diagnostiquée par IRM dans les 7 jours après le début des symptômes) et d’exclusion (réapparition de blessures et blessures sans RTP) et sont inclus dans les analyses.

 Analyse de la validité interne de l’étude

  • La validité interne est directement liée au risque de biais introduit dans la méthode pouvant influencer les résultats d’une étude. Cette étude rétrospective est une étude à haut risque de biais (pastille rouge) ne permettant pas d’interpréter les résultats.
  • La majorité des critères méthodologiques essentiels à ce type d’étude ont été respectés (considération éthique, définition des variables, description des critères d’inclusion/exclusion, description des facteurs étudiés). 
  • Cependant, aucun protocole standard de décision du RTP n’est utilisé ni aucune imagerie, laissant les médecins de l’équipe médicale décider sur des critères cliniques et subjectifs qui sont décrits dans la méthode mais qui ne sont pas détaillé dans leurs mesures ou leurs seuls d’interprétation : cessation de la douleur, flexibilité symétrique, retour à la force avant blessure, performance : vitesse de sprint, accélération/décélération, capacité à effectuer des courses à forte vitesse comme pendant un match) + leur progression en réhabilitation et leur perception du RTP. Ce manque d’information ne garantit pas la comparaison des décisions RTP.
  • De plus, la faible taille d’échantillon n’est pas adaptée aux analyses statistiques utilisées et ne permet pas de répondre à l’ensemble des questions de recherche étudiées.
  • Pour finir, les statistiques utilisées ne sont pas adaptées à la taille de l’échantillon ni aux questions de recherche posées comme expliqué ci-dessous.

 Analyse des statistiques utilisées par question de recherche 

 Analyse 1 : La durée de RTP et le score BAMIC sont-ils corrélés ?

Une régression linéaire a été réalisée entre la durée de RTP (en jours) et le score BAMIC rapporté sur une échelle de 0 à 9. Il faut noter ici qu’à l’origine le score BAMIC est défini de 0 à 4 suivant une sévérité croissante et est établie en fonction de la cross-section (proportion maximale de la surface de la blessure dans le plan transverse sur l’IRM) et de la taille de l’œdème (en cm sur l’IRM). Une lettre est ajoutée pour spécifier la localisation (a-c).
Plusieurs paramètres sont à prendre en considérations dans cette analyse :

  • Le score BAMIC a été rapporté sur une échelle de 0 à 9 mais il n’y a pas plus de précision sur la correspondance entre le grade de la classification et l’affectation sur cette échelle. Les auteurs ont probablement ordonné les scores par sévérité considérant d’abord la valeur numérique puis la lettre du grade (0a devient alors 0 et 3c 9). Bien que pouvant être compréhensible d’un point de vue pratique pour analyse, cette transformation a une influence sur la construction théorique de la classification. En effet, cela revient à considérer la classification comme un continuum de taille puis de localisation de la lésion. Cette transformation fait perdre l’intérêt de l’aspect composite qui fait l’essence même de la classification BAMIC. De plus, nos calculs avec les données fournies en supplément montrent une forte corrélation entre le score BAMIC et la taille de l’œdème, mais aucune corrélation ne ressort entre le score BAMIC et la mesure cross/section. Ce résultat est surprenant car la classification BAMIC repose normalement sur ces deux critères donc le score devrait en théorie être corrélé à ces deux variables. Cela amène à se questionner sur la fiabilité des scores BAMIC utilisés. 
  • La classification BAMIC étant par définition constitué de rangs (grades), il aurait été recommandé d’effectuer une corrélation de rangs et non une corrélation linéaire. Les données étant disponibles en suppléments, une analyse a été réalisée et a mis en évidence une corrélation entre la durée de RTP et le grade BAMIC (rho(37)=0.36, p=0.025). Rho est le coefficient de corrélation, compris entre -1 et 1 où 0 indique l’absence de corrélation et -1 ou 1 des corrélations respectivement négatives ou positives totales ; 0.36 est une corrélation positive statistiquement significative mais relativement faible. 

 Analyse 2 : Les paramètres du score BAMIC, comme la cross-section de la blessure et la taille de l’œdème, permettent-ils de prédire la durée de RTP ?

Les auteurs ont réalisé une régression multiple pour mesurer l’influence du score BAMIC, de la cross-section et de la taille de l’œdème sur le délai RTP.
Le modèle statistique utilisé n’est pas adapté, rendant cette analyse très peu fiable :

  • Comme pour l’analyse 1, le score BAMIC n’est pas très clairement explicité et peut être sujet à débats (cf explications plus hauts).
  • Le type de modèle utilisé n’est pas précisé. D’après les résultats et le report de valeurs « r », il s’agit d’un modèle linéaire, et par conséquent non adapté à la variable étudiée. En effet, les modèles linéaires requièrent la normalité de la variable dépendante. Dans ce cas la variable dépendante est le RTP et n’est pas normalement distribuée. Le RTP est mesuré en jours et prend donc des valeurs discrètes débutant à 0. La distribution des RTP est typique des variables de type « compte » assimilables à des distributions de type « poisson » (et non des distributions normales). L’analyse de ces données particulières aurait dû être faite avec un modèle adapté à leurs distributions (régression multiple poisson, régression linéaire en ayant au préalable transformé le RTP pour le rendre normal, ou encore une analyse de données temporelles bornées du type analyse de survie).
  • Le modèle inclut comme prédicteurs des paramètres du score BAMIC : la cross-section et la taille de l’œdème. Cette construction ne semble pas pertinente pour répondre à la question puisque le score BAMIC dépend par définition des deux paramètres : la cross-section et de la taille de l’œdème. Par conséquent, il est difficile de savoir ce que le modèle peut prétendre mesurer.
  • Le nombre de données est probablement insuffisant.
En l’absence de figures descriptives et de statistiques descriptives supplémentaires, il est difficile de statuer sur la représentativité de la taille de l’échantillon. Il apparait cependant clair que certains grades sont surreprésentés (grade 2b quasiment 50% des sujets) et d’autres sous-représentés (7 grades sur 10 avec maximum 3 sujets). Cette distribution n’est pas problématique en soit et doit probablement refléter une réalité, cependant son analyse implique des contraintes. L’idéal étant d’augmenter la taille de l’échantillon, sinon de rassembler certains rangs pour avoir une meilleure puissance statistique. De plus, le modèle incorpore également la cross-section et la taille de l’œdème qui ont également une certaine distribution dans la population (qui ne sont d’ailleurs pas mentionné). 

 Analyse 3 : Concordance entre la classification BAMIC et la classification de Peetrons 

La question de fond de cette analyse est pertinente, à savoir trouver (ou non) une concordance entre la classification de BAMIC et celle de Peetrons. Cependant, la méthode employée est très questionnable. De même l’objectif des auteurs n’est pas clair. Il semble que l’objectif fut de montrer ou non un accord grade à grade entre les deux classifications. Cela ne semble pas pertinent puisque les classifications ont par définition été construites de manières différentes.

Les auteurs ont calculé l’accord entre les scores attribués aux sujets selon la classification BAMIC et celle de Peetrons. Comme les deux classifications ont globalement la même notation ordonnant le grade de sévérité (de 0 à 3 ou 4), les auteurs ont calculé l’accord entre les grades selon leur sévérité attribuée par la classification (accord de 0 BAMIC avec 0 Peetrons, 1 BAMIC et 1 Peetrons, et ainsi de suite). Cette approche se voulant très simpliste est conceptuellement très déroutante. En effet, les deux classifications ont été réalisées indépendamment. Hormis le fait qu’elles soient toutes deux ordonnées par sévérité, elles reposent sur des critères différents et il est difficile d’établir l’analogie entre les deux. En d’autres termes, comment peut-on comparer l’accord entre un grade 3 de Peetrons et un grade 3 de BAMIC quand ceux-ci ne veulent pas dire la même chose ?

Une question intéressante aurait été d’établir le lien entre les deux classifications. Par exemple, en analysant le lien entre le délai RTP et chacune des classifications et de leurs grades constitutifs. Ceci pourrait permettre d’établir une analogie en termes de prédiction de délai RTP entre les scores des classifications BAMIC et Peetrons (si tant est qu’il y en est une).

 Analyse de la validité externe de l’étude

La validité externe permet d’étudier le degré d’applicabilité des résultats aux patients de votre quotidien, c’est en fait le degré de généralisation et d’extrapolation des résultats. Dans cet article, la généralisation des résultats n’est pas possible en raison du faible effectif de l’échantillon analysé. 

Conclusion

La faible qualité méthodologique de l’étude ainsi que le plan d’analyse et les moyens statistiques employés pour répondre aux objectifs de l’étude sont contestables. L’interprétation des résultats de cette étude ne semble donc pas pertinente.

Référence de l’article analysé 

Tears C, Rae G, Hide G, Sinha R, Franklin J, Brand P, Hasan F, Chesterton P. The British Athletics Muscle Injury Classification grading system as a predictor of return to play following hamstrings injury in professional football players. Phys Ther Sport. 2022 Sep 7;58:46-51. doi: 10.1016/j.ptsp.2022.08.002. Epub ahead of print. PMID: 36148699.