Lauréat prix de thèse 2022


 Paul BONIOL

 Félicitation au lauréat 2022 du prix de thèse INFORSID Paul BONIOL

 

 

Paul a été sélectionné pour sa thèse intitulée « Detection of Anomalies and Identification of their Precursors in Large Data Series Collections » .

LaboratoireLIPADE.

EtablissementUniversité Paris cité, en collaboration avec PRISME, EDF R&D.

EncadrementThemis Palpanas.

Mots-clefsSĂ©ries temporelles - DĂ©tection d'anomalies - Machine learning.

RésuméLes larges collections de sĂ©ries temporelles deviennent une rĂ©alitĂ© dans un grand nombre de domaines scientifiques et sociaux, comme la finance, les sciences de l'environnement, l'astrophysique, les neurosciences, l'ingĂ©nierie ou les mĂ©tiers du numĂ©rique. Il y a donc un intĂ©rĂŞt et un besoin de plus en plus importants de dĂ©velopper des techniques efficaces pour analyser et traiter ce type de donnĂ©es. De manière informelle, une sĂ©rie temporelle est une sĂ©quence ordonnĂ©e de points ou de valeurs. Une fois les sĂ©ries collectĂ©es et disponibles, les utilisateurs ont souvent besoin de les Ă©tudier pour en extraire de la valeur et de la connaissance. Ces analyses peuvent ĂŞtre simples, comme sĂ©lectionner des fenĂŞtres temporelles, mais aussi complexes, comme rechercher des similaritĂ©s entre des sĂ©ries ou dĂ©tecter des anomalies, souvent synonymes d’évolutions soudaines et inhabituelles possiblement non souhaitĂ©es, voire de dysfonctionnements du système Ă©tudiĂ©. Ce dernier type d’analyse reprĂ©sente un enjeu crucial pour des applications dans un large Ă©ventail de domaines partageant tous le mĂŞme objectif : dĂ©tecter les anomalies le plus rapidement possible pour Ă©viter la survenue de tout Ă©vĂ©nement critique, comme par exemple de prĂ©venir les dĂ©gradations et donc d'allonger la durĂ©e de vie des systèmes. Par consĂ©quent, dans ce travail de thèse, nous traitons les trois objectifs suivants : (i) l’exploration non-supervisĂ©e de sĂ©ries temporelles pour la dĂ©tection rĂ©trospective d’anomalies Ă  partir d'une collection de sĂ©ries temporelles. (ii) la dĂ©tection non-supervisĂ©e d’anomalies en temps rĂ©el dans les sĂ©ries temporelles. (iii) l’explication de la classification d’anomalies connues dans les sĂ©ries temporelles, afin d’identifier de possibles prĂ©curseurs. Dans ce manuscrit, nous introduisons d'abord le contexte industriel qui a motivĂ© la thèse, des dĂ©finitions fondamentales, une taxonomie des sĂ©ries temporelles et un Ă©tat de l'art des mĂ©thodes de dĂ©tection d’anomalies. Nous prĂ©sentons ensuite nos contributions scientifiques en suivant les trois axes mentionnĂ©s prĂ©cĂ©demment. Ainsi, nous dĂ©crivons premièrement deux solutions originales, NormA (basĂ©e sur une mĂ©thode de clustering de sous-sĂ©quences de la sĂ©ries temporelles Ă  analyser) et Series2Graph (qui s’appuie sur une transformation de la sĂ©ries temporelle en un rĂ©seau orientĂ©), pour la tâche de dĂ©tection non supervisĂ©e de sous-sĂ©quences anormales dans les sĂ©ries temporelles statiques (i.e., n’évoluant pas dans le temps). Nous prĂ©sentons dans un deuxième temps la mĂ©thode SAND (inspirĂ© du fonctionnement de NormA) dĂ©veloppĂ©e pour rĂ©pondre Ă  la tâche de dĂ©tection non-supervisĂ©e de sous-sĂ©quences anormales dans les sĂ©ries temporelles Ă©voluant de manière continue dans le temps. Dans une troisième phase, nous abordons le problème liĂ© Ă  l'identification supervisĂ©e des prĂ©curseurs. Nous subdivisons cette tâche en deux problèmes gĂ©nĂ©riques : la classification supervisĂ©e de sĂ©ries temporelles d’une part, l'explication des rĂ©sultats de cette classification par l'identification de sous-sĂ©quences discriminantes d’autre part. Enfin, nous illustrons l'applicabilitĂ© et l'intĂ©rĂŞt de nos dĂ©veloppements au travers d'une application portant sur l'identification de prĂ©curseurs de vibrations indĂ©sirables survenant sur des pompes d'alimentation en eau dans les centrales nuclĂ©aires françaises d'EDF.


Actualités


Envoyer un message à la communauté

Site web réalisé à partir du template conçu par Séverine Rubin du laboratoire LS2N LS2N