AudIoTi - Écouter nos objets pour mieux les comprendre
Ingénierie et Architecture

L’analyse des signaux acoustiques émis par les matériaux et les objets est considérée comme un axe de développement prometteur pour l’Internet des objets (IoT). Ce projet concerne la conception et le développement d’une plateforme (HD & SW) pour la mesure et l'analyse de l'audio pour les applications de l'IoT, où la nouveauté résidera dans la combinaison des éléments suivants :
- Un module électronique basse-puissance et bas-coût.
- Un protocole de communication sans-fil dédié au traitement de signaux audio.
- Un algorithme de Machine Learning (ML) pour l’analyse audio au niveau Edge.
Les résultats permettront la valorisation dans les domaines suivants :
- Industrie, automobile : détection et prédiction des pannes, diagnostics en fonctionnement.
- Médecine : suivi de patients avec des maladies de respiration chroniques.
- Suivi environnemental : détection de l'activité de la faune, suivi des animaux.
- Génie civil : monitoring préventif d’ouvrages d’art.
Écouter pour mieux comprendre fait partie de notre vie quotidienne, nous aidant à identifier ou détecter des anomalies : écouter un moteur, une machine, une respiration ou un mouvement horloger révèle de précieuses informations pour prévenir, analyser ou intervenir.
Afin de développer un prototype et d’en évaluer les performances, nous avons étudié deux jeux de données différents. Ces datasets catégorisent des sons issus de machines industrielles, représentant soit un fonctionnement normal, soit différents types de dysfonctionnements ou de dégradations. Ils diffèrent principalement par leur échelle, avec respectivement environ 4’000 et 26’000 observations.
En combinant une réduction de dimensionnalité robuste, des modèles de machine learning à la fois flexibles et légers, et une répartition efficace des tâches entre les nœuds de calcul (nodes) et les dispositifs en périphérie (edge), nous avons conçu un pipeline à la fois scalable et généralisable.
L’évaluation de ce pipeline sur les deux jeux de données montre d’excellentes performances pour les modèles supervisés, notamment sous des contraintes très strictes en termes de taux de faux positifs — un critère essentiel pour un système de surveillance continue. Les modèles non supervisés affichent également de bonnes performances, mais requièrent davantage de données pour atteindre un niveau comparable, particulièrement lorsque des contraintes d’erreur très fortes sont imposées. Ces modèles demeurent néanmoins pertinents dans des contextes où les anomalies sont rares ou absentes, les données sont abondantes et l’intervention humaine doit être limitée.
Concernant les temps d'entraînement et d'exécution, la charge est gérée de manière raisonnable par les dispositifs edge et les nœuds. En modélisant l’évolution de cette charge en fonction du volume de données, nous estimons que le pipeline peut traiter jusqu’à O (107) observations sans modifications majeures de l’infrastructure matérielle. Une simple augmentation de la mémoire, permettant de stocker davantage de données et d’élargir l’espace de swap, devrait suffire.