Équipementier industrielDocument intelligence →

Traitement automatique de 2 000 certificats matière par mois

Automatisation complète du pipeline de réception et d'intégration ERP des certificats EN 10204 3.1 et 3.2. OCR + LLM en pipeline, validation par règles métier, intégration SAP MM, interface de révision pour les exceptions.

94 %

traitement sans révision humaine

3,2 s

latence moyenne par document

– 0,3 ETP

de charge de saisie manuelle

Contexte

Le problème

2 ETP dédiés à la saisie manuelle

2 000+ certificats EN 10204 (3.1 et 3.2) reçus par mois de 180 fournisseurs différents. Chaque certificat nécessitait la saisie de 12 à 25 champs dans SAP MM.

Formats hétérogènes et non standardisés

La norme EN 10204 définit le contenu des certificats, pas leur mise en forme. Chaque fournisseur a son propre format : colonnes, tableaux, ordres de champs différents.

Erreurs de saisie et délais de réception matière

Taux d'erreur de saisie estimé à 3 %. Retards d'intégration ERP de 24 à 72h après réception physique. Blocages ponctuels en production pour non-disponibilité des certificats dans le SI.

Contrainte souveraineté des données

Données techniques sensibles (composition chimique, traitements thermiques). Déploiement on-premise exigé — pas de traitement sur cloud public américain.

Solution

Architecture déployée

Ingestion

Récupération multi-canaux

Monitoring boîte email dédiée (PDF joints), intégration portail fournisseur, dépôt SFTP. Déclenchement automatique du pipeline dès réception.

Pré-traitement

Préparation image

Détection orientation, déskew, amélioration contraste. Critique pour les scans de mauvaise qualité issus de certains fournisseurs.

OCR

Azure Document Intelligence on-premise

Instance Azure DI déployée on-premise (conteneur Docker). Extraction layout + texte. Choix justifié par les contraintes de souveraineté des données et les performances sur tableaux.

Extraction

LLM structuration avec score de confiance

Modèle LLM fine-tuné sur 800 certificats annotés. Extrait 22 champs cibles avec score de confiance par champ. Prompt engineering pour la gestion des formats inconnus.

Validation

Règles métier et contrôle cohérence

Vérification des plages de valeurs (composition, propriétés mécaniques), conformité aux spécifications d'achat SAP, détection des doublons. Routage vers révision si confiance < 0,80.

Intégration

SAP MM via BAPI RFC

Création du certificat matière dans SAP MM avec tous les champs structurés. Notification au service réception. Interface web de révision pour les exceptions (6 % du flux).

Résultats

Résultats observés

Mesurés sur les 6 premiers mois de production.

94 %

Traitement sans révision humaine

Dès le 3e mois. Le 1er mois : 76 %. Amélioration par enrichissement du dataset de fine-tuning avec les cas d'exception rencontrés.

3,2 s

Latence moyenne par document

De la réception email à la disponibilité dans SAP MM. Contre 24 à 72h en mode manuel.

0,4 %

Taux d'erreur résiduel

Sur les certificats traités automatiquement. Contre 3 % en saisie manuelle. Erreurs résiduelles principalement sur les champs libres non structurés.

– 0,3 ETP

Réduction de charge

De 2 ETP à 0,3 ETP — uniquement pour la révision des exceptions et la supervision du système. Les 1,7 ETP libérés ont été réaffectés à des tâches qualité à valeur ajoutée.

Retour d'expérience

Ce qu'on en retient

Le déploiement on-premise d'Azure Document Intelligence est techniquement plus complexe mais offre les mêmes performances que la version cloud. Prévoir 2 semaines supplémentaires pour la mise en place.
Le fine-tuning du LLM sur un corpus de 800 certificats annotés a été décisif pour atteindre 94 % d'automatisation — le modèle généraliste seul plafonnait à 78 %.
L'interface de révision humaine est critique pour l'amélioration continue : chaque correction alimente le dataset de réentraînement. Ne pas la traiter comme secondaire.
La détection des doublons (même certificat reçu plusieurs fois via différents canaux) s'est révélée importante — représentait 4 % du volume initial.
Le score de confiance par champ (pas seulement global) a permis de ne mettre en révision que les documents avec des incertitudes sur des champs spécifiques — réduisant la charge de révision de 40 %.

Démarrer

Un flux documentaire à automatiser ?

Certificats matière, dossiers conformité, factures fournisseurs : décrivez le type, le volume et le SI cible. Analyse de faisabilité sous 48h.