[Help] [Aide] [Up]

The Cancer Journal - Volume 9, Number 3 (May-June 1996)

éditorial


De l'analyse factorielle des correspondances



Dans le domaine de la recherche clinique, la validité des résultats est en règle appuyée sur l'analyse statistiques des données. Dans les protocoles simples, on utilise les tests de comparaisons de moyenne ou de fréquence, moins souvent on cherche une corrélation entre paramètres. Dans les protocoles les plus élaborés, on a recours à des méthodes d'analyse mulivariées telles l'analyse en composante principale, l'analyse de régression multiple, le modèle de Cox ou l'analyse discriminante. Ces méthodes rendent de grands servives, mais elles ont des limites que d'autres méthodes permettent de franchir.

A l'occasion de la publication dans ce numéro du Journal d'un travail pour lequel on a utilisé l'analyse factorielle des correspondances (AFC), nous allons essayer de montrer l'intérêt de cette méthode d'analyse des données cliniques, techniques et thérapeutiques. En effet cet outil mathématique, déjà ancien a été peu utilisé en médecine.

En quoi l'AFC se distingue-t-elle des autres modes de traitement des données?

1- Les lecteurs familiers avec la pratique des bases de données savent que dans une base on peut introduire de nombreux sujets (malades) et de nombreux paramètres (signes, actes, résultats...) pour chaque sujet, et qu'on peut ultérieurement procéder à tous les tris possibles par catégorie de sujet, ou par catégorie de paramètres; que les données soient ou non numériques. Dans l'AFC on peut dans un tableau à deux entrées inclure autant de sujets que l'on voudra, à raison de un par ligne, et autant de signes que l'on voudra, avec une catégorie de signes par colonne.
Dans le même tableau :
- on peut mettre des sujets sains et des sujets malades;
- le même sujet peut apparaître sur plusieurs lignes, à raison d'une ligne par étape évolutive de sa maladie;
- mettre des sujets ayant des diagnostics et/ou des traitements différents, ou des sujets malades sans diagnostic établi.

2- A partir de cette base de données, chaque nouveau sujet ajouté à la base peut être l'objet d'une analyse personnelle, dont les résultats peuvent lui être immédiatement profitables en terme de classement diagnostique, de décision analytique, pronostique et thérapeutique. Plus la base sera riche de sujets enregistrés, plus les données manquantes seront rare, plus la base sera diversifiée, plus grande sera son utilité et sa valeur opératoire. En cela elle fonctionne comme le moteur d'inférence d'un système d'intelligence artificielle.

3- On comprend bien que l'AFC, si elle permet d'associer dans un même processus analytique des malades assignés à des maladies différentes, se prête parfaitement à l'exploration de la co-morbidité. Le vieillissement de la population a pour conséquence que, dans la médecine contemporaine, les sujets atteints de plusieurs maladies simultanément sont en nombre croissant. Construite sans préoccupation de partage de la pathologie en spécialités, cette base interdisciplinaire autorise, non plus des comparaisons de caractères, mais des comparaisons de profils.

L'AFC reproduit, pendant le bref moment où la machine travaille sur les données qu'elle possède, un processus, en partie, analogue à l'invention de la médecine anatomo-clinique, c'est à dire le regroupement des signes en aggrégats: syndromes ou maladies. Chaque fois qu'on ajoute un sujet il ajoute son profil aux profils des sujets préexistants, il modifie la structure de l'ensemble et contribue tant soit peu à enrichir sa validité du système. De même que chaque malade, pourvu que son cas soit convenablement décrit par une publication, vient s'ajouter au corpus du savoir médical.

4- L'AFC autorise la construction
- des groupes de patients homogènes qui vont reproduire la classification traditionnelle ou proposer un autre mode de classification;
- des groupes de paramètres en fonction de leurs liaisons;
- des groupes de patients et de paramètres en terme de "proximités explicatives"
Chaque patient conserve son individualité et peut avec l'AFC être suivi pendant l'évolution de sa maladie. L'évolution se traduisant par une trajectoire sur les cartes de l'AFC. A chaque moment, pour chaque étape, comme en clinique traditionnelle, mais avec un atout supplémentaire, le thérapeute peut à loisir piloter le traitement au plus près, pour corriger la trajectoire et diriger le malade vers l'objectif choisi, amélioration avec guérison chaque fois que possible.

On conçoit qu'échappant largement à la contrainte de l'hypothèse préalable (qu'il s'agisse de la distribution [normale] des variables, de leurs relations entre elles, ou du système de classification des maladies), l'AFC puisse fonctionner comme un générateur d'hypothèses, ressemblant en cela aux réseaux neuronaux ou aux modèles d'intelligence artificielle, sans pour autant se substituer au travail intellectuel irremplaçable du médecin. On ne peut avec cette technique, non plus qu'avec aucune autre se défausser de ses responsabilités décisionnelles.

La médecine relevant des sciences de l'imprécis, souvent déçus par les aides à la décision promises par les informaticiens et les statiticiens par trop triomphalistes, les médecins sont en droit d'exiger des méthodes analytiques adaptées à la logique floue des excellents praticiens. L'AFC ne peut prétendre être la réponse universelle à l'études des phénomènes complexes, déterminés, mais imprévisibles, qui sont le fait des humains, organismes vivants dans un environnement physico-chimique complexe et complexifié par la présense ubiquitaire des autres organismes vivants et des éléments culturels entremèlés de façon inextricables autour et en chacun d'entre-nous.

L'exigence moderne comporte en médecine

- un refus des comportements binaires de type oui/non qui caractérise parmi d'autres, les tenants sectaires de la biologie moléculaire dont la prétention s'inscrit aujourd'hui dans la génétique normative;

- une réévaluation des limites imprécises ou de l'intrication entre le normal et le pathologique;

- une maîtrise de la complexité par une réduction de la dimensionalité des phénomènes et non en isolant les intervenants (patients ou tests) de leur contexte;

- une économie des informations par l'identification des informations dépendantes génératrices d'un bruit de fond et dont la production et le maniement coûte en temps et en moyens; (variante actuelle du principe d'Occam);

-une relation logique entre les médecins et les techniques d'aide à la décision:
- exploration du champ et connaissance des limites,
- pratique diversifiée n'écartant aucune méthode, puisqu'aucune n'est a priori sans intérêt, non plus qu'aucune n'est universelle,
- maîtrise de la technique et contrôle de la décision responsable par le médecin, même quand il est bien assité par l'ordinateur, outil qu'il faut maintenir en servitude.

Jean-Yves Bansard, Michel Kerbaol, Jean-Claude Salomon$
$: correspondence: salomon@tribunes.com


Doré J-C. Maitriser la complexité en matière d'information biomédicale.
Science Tribune (à paraître), http://www.iway.fr/sc/tribune

[Up]