Partitionner des données corrompues, à l'aide de divergences de Bregman

Résultat scientifique Mathématiques

Des questions d’horizons multiples nécessitent de savoir déterminer des représentants fictifs d’un ensemble de données réelles. Des méthodes dites de partitionnement par divergences de Bregman permettent cette détermination de représentants mais celles-ci sont très sensibles au bruit statistique (tel que les erreurs de mesures ou conséquences des méthodes de transmission). Dans un travail récent en collaboration avec Aurélie Fischer et Clément Levrard, Claire Brécheteau, de l'Institut de recherche mathématique de Rennes (IRMAR, CNRS/ENS Rennes/Université de Rennes 1/Université Rennes 2), introduit des méthodes robustes moins sensibles au bruit. Ces méthodes sont par exemple applicables dans des domaines aussi différents que l'analyse de formes ou la linguistique.

1. Motivation

Diverses questions, par exemple celles des types en anthropologie, ou bien d'autres, d'ordre pratique, comme celles de la normalisation des objets industriels, exigent pour leur solution la détermination de n représentants fictifs d'une nombreuse population, choisis de manière à réduire autant que possible les écarts entre les éléments de la population et ceux de l'échantillon, l'écart étant mesuré entre tout élément réel et l'élément fictif qui lui est le plus proche.

1.1 Partitionner une population à l'aide de l'algorithme de Lloyd

Si construire des groupes à partir d'une population d'individus ou d'objets par exemple était déjà d'actualité en 1956, elle le demeure toujours. L'utilisation des outils numériques fournit une quantité massive de données que l'on peut chercher à interpréter, notamment en les regroupant judicieusement suivant un critère préalablement défini. Souvent, les données peuvent être assimilées à des points de l'espace Euclidien Rd. Partitionner ces données consiste alors à former k groupes disjoints sur la base d'un critère et à associer un représentant (ou centre) à chacun de ces groupes. On appelle dictionnaire un vecteur de k représentants.

Contact

Claire Bécheteau
Maîtresse de conférences à l'Université Rennes 2, à l'Institut de recherche mathématique de Rennes (IRMAR, CNRS/ENS Rennes/Université de Rennes 1/Université Rennes 2)