Janvier 2009 /180
Janvier 2009 /180

Suivre le mouvement

Un brevet pour le traitement de l’image

Le Pr Marc Van Droogenbroeck et le chercheur Olivier Barnich vont faire breveter des travaux  portant sur la détection du mouvement dans l’image. Ce duo d’experts allie expérience et innovation avec, d’un côté, un ingénieur en télécommunications déjà aguerri et, de l’autre, un jeune Liégeois ingénieur en électronique.

Nom de code : VIBE
Aujourd’hui, ils présentent Visual Background Extractor (VIBE), un système d’exploitation qu’ils ont élaboré conjointement, dans le cadre de la thèse d’Olivier Barnich. Cette thèse, comme l’explique le Pr Van Droogenbroeck, s’inscrit dans la problématique du  traitement de la silhouette dans l’image. Un travail de fourmi réalisé à l’échelle du pixel. « Le but était d’optimiser la détection du mouvement dans l’image par la caméra, explique-t-il. Or, la détection implique, pour le programme, la comparaison par rapport à une base de données d’images précédentes. » En effet, l’œil humain qui aperçoit, par exemple, une voiture sur une route déserte ne la détecte que parce qu’elle “surgit” dans le paysage. Si ce phénomène est heureusement inconscient chez l’humain, il doit être pris en compte pour être analysé dans la prise de vues de la caméra.

mvt11mvt2

L'algorithme ViBe, développé à l'ULg, est capable d'isoler automatiquement, avec une grande précision, les personnes en mouvement dans l'image.

Concrètement, le processus identificatoire consiste à établir une classification foreground/background (avant-plan/arrière-plan). « Dans la littérature scientifique, le mouvement est un élément informatif essentiel dans l’image, expose le chercheur. Techniquement, il s’agit de reproduire, sous forme d’une discrimination binaire noir et blanc, cette information en mettant en blanc les éléments en mouvement à l’avant-plan (foreground), et en laissant en noir les éléments fixes considérés comme constituant l’arrière-plan (background). A  partir de là, la problématique centrale est de savoir comment la caméra va organiser dans le temps la hiérarchisation des images précédemment enregistrées pour identifier un élément nouveau. »

C’est donc la question du passé et de son organisation qui constitue la pierre d’achoppement de la recherche. « Dans les systèmes qui existent déjà, les images du passé sont modélisées sous une forme gaussienne, explique Marc Van Droogenbroeck. C’est-à-dire que le système considère un nombre d’images antérieures, par exemple 100, et les organise sous la forme d’une courbe de Gauss. Celle-ci construit sa moyenne sur un échantillon afin de déterminer, pour chaque nouvel élément, s’il se retrouve soit dans la moyenne et n’est donc pas informatif (arrière-plan), soit hors de la moyenne et passe alors, de facto, à l’avant-plan. » Le problème de l’approche gaussienne est qu’elle recharge son stock d’images antérieures en remplaçant la plus ancienne par la dernière arrivée, à la manière de perles enfilées. Et, avec des images mobiles mais répétitives, « la gaussienne, statistiquement, aura tendance à se resserrer et à considérer comme non-informatif un pourcentage des images toujours plus grand. Au bout d’un certain temps, il y a un risque de produire un rendu en décalage par rapport à l’image originale ».

Et c’est précisément sur ce point que porte l’objet du brevet. Comment maîtriser la base de données dont se sert le système pour, in fine, stabiliser la reproduction du mouvement et rendre le système autonome ? « En trouvant une alternative permettant d’éviter le système de moyenne prédictive de la gaussienne, reprend le professeur. Dans notre système, nous limitons à dix valeurs antérieures la mémoire utilisée par la caméra. Chaque nouvelle valeur enregistrée par la caméra vient remplacer arbitrairement l’une des dix anciennes. Et si celle-ci trouve, dans la chaîne des dix, deux valeurs parfaitement équivalentes, elle considérera la dernière arrivée comme faisant partie de l’arrière-plan. » Ainsi, en procédant arbitrairement au remplacement de chaque valeur, le résultat obtenu acquiert une constance dans le temps. Le logiciel a appris à apprendre.

Souriez, vous êtres comptés !

Les applications de ce programme sont nombreuses. « Dans la mesure où la captation d’un mouvement dans une image est à la base de la majorité des applications et constitue 90% du travail, notre système peut concerner, au sens large, quasi toutes les applications qui font de l’analyse d’image comme les opérations de comptage de personnes ou de voitures, par exemple. » L’aéronautique et l’industrie du jeu vidéo pourraient bénéficier de cette avancée ainsi que la vidéosurveillance. Et le professeur de conclure : « Le travail en temps réel d’une part, et l’autorégulation du software de l’autre étaient les deux objectifs que nous voulions atteindre au commencement de nos recherches. » C’est désormais chose faite.

Julien Fox

Facebook Twitter