Maintenance prédictive : critères de sélection des équipements et audit des données

Prioriser les équipements : 4 critères de sélection

Commencer par instrumenter tous les équipements d'une ligne est une erreur courante. Le ROI de la maintenance prédictive se concentre sur quelques équipements critiques — identifier lesquels est la première décision à prendre.

Les 4 critères de sélection par ordre d'importance :

Criticité de l'arrêt : un arrêt sur cet équipement arrête-t-il la ligne ? arrête-t-il le site ? Le coût horaire d'arrêt doit être estimé. C'est le numérateur du ROI.
Fréquence des défaillances : un équipement qui tombe en panne une fois tous les 5 ans n'est pas un candidat prioritaire, même s'il est critique. Ciblez les équipements avec 2+ défaillances non planifiées par an.
Détectabilité par capteurs : la défaillance est-elle précédée d'une dégradation mesurable par vibration, courant, température ou pression ? Les défaillances électriques subites ou les ruptures par surcharge ne sont pas détectables en prédictif — ne pas instrumenter pour ce type de défaillance.
Données historiques disponibles : les données capteurs de l'équipement sont-elles archivées dans un historian ? Sur quelle période ? Au moins 12 à 18 mois d'historique avec des événements de défaillance documentés est le minimum pour entraîner un modèle supervisé.

Audit des données historiques : ce qu'on cherche

Qualité des séries temporelles

Avant d'entraîner quoi que ce soit, évaluez la qualité des données capteurs sur les équipements candidats :

Taux de gaps : des interruptions fréquentes dans les séries (arrêts maintenance, coupures réseau, changements de capteur) créent des artefacts dans le feature engineering. Quantifiez le pourcentage de données manquantes par période.
Granularité : pour les vibrations (détection roulement, cavitation), vous avez besoin d'au moins 1 kHz d'échantillonnage. Une mesure toutes les 10 secondes ne permet pas de faire du spectral. Vérifiez ce que votre historian stocke réellement.
Dérive des capteurs : un capteur non calibré depuis 3 ans dont la ligne de base a drifté de 20 % entraîne un modèle qui apprend la dérive, pas la défaillance. Identifiez les capteurs à historique suspect.

Labellisation des pannes passées

C'est le travail le plus chronophage et le plus sous-estimé. La qualité de votre historique de pannes conditionne directement la qualité du modèle supervisé.

Ce qu'on cherche dans les OT CMMS :

Date et heure de la panne (pas seulement de l'intervention)
Type de défaillance (mode de défaillance, pas seulement l'organe remplacé)
Équipement et sous-ensemble concernés
Distinction panne soudaine vs. dégradation progressive

Dans la plupart des parcs industriels, 40 à 60 % des OT sont insuffisamment documentés pour servir de labels. La session de requalification des OT avec le responsable maintenance est une étape incontournable — prévoyez 2 à 4 jours pour un historique de 2 ans.

Anomaly detection vs. estimation RUL : le bon outil pour le bon problème

Quand utiliser l'anomaly detection

L'anomaly detection (Isolation Forest, autoencoders, LSTM-based) est adapté quand :

Vous n'avez pas (ou peu) de données de défaillances labellisées
Vous démarrez le projet et souhaitez avoir un premier signal rapidement
Les modes de défaillance sont multiples et pas complètement connus
La durée de dégradation avant défaillance est variable

Ses limitations : il détecte que quelque chose est anormal, pas ce qui va tomber en panne ni quand. Le taux de faux positifs est plus élevé qu'un modèle supervisé — attendez-vous à des alertes à investiguer plutôt qu'à des prédictions actionnables directement.

Quand utiliser l'estimation de RUL

L'estimation de durée de vie résiduelle (RUL) est pertinente quand :

Vous avez un historique de défaillances documentées sur le type d'équipement ciblé (minimum 8 à 12 événements par mode de défaillance)
La dégradation est progressive et mesurable (roulement, usure, cavitation — pas les ruptures par surcharge)
Vous avez besoin d'un horizon de prédiction pour planifier les interventions maintenance

Les LSTM et les modèles de survie (Weibull, Cox) donnent de bons résultats sur les équipements rotatifs avec suffisamment de données. Mais ils nécessitent un travail de feature engineering spectral (FFT, enveloppe) que les modèles génériques ne font pas automatiquement.

Un piège fréquent : instrumenter sans historique préalable

Ajouter des capteurs neufs sur des équipements sans historique de pannes est le scénario le moins efficace à court terme. Vous commencez avec zéro label — il faudra attendre plusieurs pannes sur le nouveau dispositif pour avoir suffisamment de données pour un modèle supervisé.

La stratégie plus efficace : commencer par les équipements déjà couverts par le historian, avec un historique de pannes partiellement documenté. L'anomaly detection peut démarrer rapidement. Le modèle supervisé suivra une fois les pannes accumulées.

Les nouveaux capteurs sur équipements non couverts sont pertinents, mais planifiez 12 à 18 mois avant d'en tirer un modèle supervisé performant.