Power Automate + AI Builder : des centaines d’heures gagnées grâce à la lecture automatique de PDF

Le besoin initial

Un de mes clients devait récupérer les numéros de commande inscrits dans plusieurs milliers de factures PDF afin de les injecter dans un nouvel outil de suivi de facturation.

La bonne nouvelle, c'est que le numéro de commande suit un format très reconnaissable, du type “ABC123456A” → 3 lettres, 6 chiffres, 1 lettre.
Idéal pour une extraction via expression régulière (RegEx).

Les prérequis

Pour mettre en place la solution, il vous faut :

  • Une bibliothèque SharePoint (ou un dossier OneDrive) contenant les PDF à analyser 
  • Une Power Automate standard + des crédits AI Builder / Copilot disponible sur votre environnement pour la reconnaissance de texte
  • Un format de numéro de commande clairement identifiable, par exemple :
    [3 lettres][6 chiffres][1 lettre]
  • Un fichier Excel configuré pour exécuter une RegEx via un Office Script

⭐ Les étapes du flux Power Automate

Créez un flux avec le déclencheur de votre choix.

Ici, nous allons nous concentrer sur la lecture d'un PDF et récupération du numéro de commande.

1. Récupérer le contenu du PDF

Ajoutez l'action Get file content using path (Obtenir du contenu de fichier à l’aide du chemin d’accès) et configurer les paramètres suivants : 

  • Site Address : l’adresse du site SharePoint qui contient la bibliothèque de documents avec les PDF
  • File Path : sélectionnez le fichier à analyser en cliquant sur l’icône de dossier

2. Extraire le contenu du PDF

Ajouter l'action Recognize text in image or document (Reconnaître le texte dans une image ou un document PDF)  et configurez-la comme indiqué ci-dessous :

Cette action renvoie le contenu du PDF sous forme de texte brut, que l’on pourra analyser ensuite.

L'action fonctionne aussi bien pour des PDF texte ou des PDF scannés (images lues avec OCR)

3. Créer l’Office Script pour exécuter la RegEx

  • Créez un fichier Excel stocké dans SharePoint ou OneDrive
  • Ouvrez-le, puis cliquez sur l’onglet AutomateNew Script
  • Supprimez le code par défaut et remplacez-le par :

function main
    (
        workbook: ExcelScript.Workbook, inputString: string, pattern: string, flags: string
    ): Array<string> {
    let regExp = new RegExp(pattern, flags);
    let matches: Array<string> = inputString.match(regExp);

    if (matches) {
        return matches;
    } else {
        return [];
    }
}

⚠️ Ce code n'a pas besoin d'être modifié, la RegEx sera définie dans Power Automate.

  • Renommez le script afin de le retrouver facilement dans Power Automate.

4. Exécuter l'Office Script dans Power Automate

Ajoutez ensuite l’action Run script (Exécuter un script) puis sélectionner le fichier Excel précédemment créé.

Indiquez ensuite les 3 paramètres qui vont permettre de spécifier comment la RegEx doit être exécutée :

  • inputString : le texte extrait du PDF (contenu dynamique)
  • pattern : votre expression régulière, dans notre exemple :
    [A-Z]{3}\d{6}[A-Z]$
  • flags : vos modificateurs RegEx (g, i)

 

Le script renverra le numéro de commande détecté — ou une liste vide si aucun match.

5. Exploiter le numéro de commande

Une fois récupéré, vous pouvez exploiter ce numéro dans de commande dans la suite du flux, comme par exemple :

  • L’enregistrer dans une colonne SharePoint
  • Mettre à jour une table Dataverse
  • L’ajouter dans un tableau Excel
  • Envoyer un email de contrôle
  • Ou encore alimenter un outil de SAV / helpdesk

⚠️ Limites, pièges courants et bonnes pratiques

  • Les PDF scannés nécessitent de l’OCR via AI Builder
  • Vérifiez que le numéro de commande est réellement unique dans chaque document
  • Prévoyez un scénario “aucun numéro trouvé” pour éviter les erreurs silencieuses
  • Conservez un journal d’erreurs dans une liste dédiée 

✅ Conclusion

Avec ce flux Power Automate, l’extraction d’un numéro de commande dans des milliers de PDF devient un processus rapide et entièrement automatisé ! Plus besoin d’ouvrir chaque fichier : le texte est reconnu, analysé, puis exploité selon les besoins.

C’est un exemple concret du gain de temps et de fiabilité que l’automatisation peut apporter aux métiers ! Et surtout, la solution reste évolutive : nouveaux formats, nouveaux champs à extraire, intégration à d’autres process… tout peut s’adapter en quelques clics.